MapR勉強会にて

先日MapR勉強会に参加した、というか主催者だったので、一応まとめ。
細かい内容とかは以下にまとめてくださった方々がいらっしゃるので感謝でございます。

@znj6さん
MapR(GreenPlumHD)の中身説明会参加
http://zenjiro.wordpress.com/2012/01/19/inside-mapr-briefing/

@johtaniさん
2012.01.20 Friday
MapR中身説明会に参加しました。
http://johtani.jugem.jp/?eid=57

t_otodaさん
[Hadoop][MapR]MapR(GreenPlumHD)の中身説明会に参加してきました。
http://tech.hatenablog.com/entry/2012/01/19/234644

moguzoさん
「MapR(GreenPlumHD)の中身説明会」に参加してきました。
http://mogemogu.hatenablog.com/entry/2012/01/20/011807

あとは、ひしだまさんのトギャッター
http://togetter.com/li/244244

それからついでに、草薙さんの解説ですね。
http://d.hatena.ne.jp/nagixx/20111216/1324006829?PHPSESSID=9d59999a496d495f782647a94315862d

発表者は、EMC(もとSUN)の草薙さんと本国のEMCサイドは、Susheelさん(もとYahoo!)
事の起こりは、EMCサイドからコミュニティに内容を紹介したいので的な話があったので。社内で検証はしているとは言え、わからない部分もあるので、ちょうど良いから、みんなで聞いてみようということで企画しました。

参加者はほぼ定員上限まで来てくれて、事後キャンセルの人はあまり居なかったようです。また質問もかなり出て、ほぼ時間目一杯という感じで終了。正直、Susheelはコアのエンジニアではないよ、と聞いていたので、参加者予定者とか見ていて、「こりゃかなりヤバくね?」とか思っていました。が、草薙さんが、かなり内容を把握していたため、いろいろな質問をきちっと丁寧に答えてくれた感じだったと思います。

(なんというかHadooperのコアな方が参加する勉強会は割と真剣ガチな質問がくるので、やる方も大変だとは思いますが、真面目な意見を聞ける貴重な場なので、活かすも殺すも評価をどう受け止めるかだと思います。)

viでのデモなぞは、予想通りの反応でHadoopをやっているひとほど、かなりの印象をもったと思います。全体的な評価は「まぁ使ってみないとなんとも言えないけど、見る限りではそこそこいいんじゃない。特に運用。」という感じだったと思います。勿論ばらつきはありますが。・・それから、「分散ファイルシステム周りでやれることは一通り全部やっている印象ですね」的な意見もありました。

書き込みがTX処理というのも、ちょっとびっくりしました。一応分散ファイルシステムのはずなんで・・・って、そういえばMSの萩原さんも同じようなことを言っていたな、とおもったら某所から教えてもらいました。

http://www.sumobrain.com/patents/wipo/Map-reduce-ready-distributed-file/WO2011160054A1.pdf
うーん、かなり奥がある気がします・・・単純じゃないですね。

個人的にはQAサイクルについては、もっと突っ込んだ回答が欲しかったので、この辺は不満です。まぁあとで聞いてみようかと。もっとも、Hadoopのリリースサイクルや、品質等については、個人的には残念な部分もおおいので、MapR的な意見は賛成です。(・・・てなことを言ったらBigTopがあるじゃないか!的な話があったので、見てみたのですが、さらに残念感が加速しただけでした。)

正直、この辺のQA関連の「あり方」は、OSSベースのものでバグとりまくりですよ的なClouderaなやり方と、そもそも根本からやり直さないといけない部分はあるよね的なMapRなやり方と、それぞれそれなりの様々な考えがあってもいいと思います。あとは使い方とかマーケットですね。自分で使うものとお客さんに売るものではやはり、いろいろ意味は違うでしょう。

それから、OSSHadoopに対して商用はどうよ、って意見もあるようですが、個人的にはいまさら、そういうナイーブな議論に参加するつもりもないです。そもそも、クラウド時代になり、商用ライセンスの存在意義が薄くなっているのが現在のコンテクストです。旧来の対立軸をまた持ち出すのは、センスが悪いと思っています。もう少し別の考え方が欲しいですね。

基本的には、どんなソフトでも、「品質が担保できていなければ、適切な価値を顧客に届けることはできない」と思っています。価値が届けられないのであれば、商用であろうとOSSであろうと等しく、自分にとっては意味がありません。品質が良いか悪いかは、OSSだから商用だからで違うとは思っていません。OSSでも品質の良いものはあるし、商用なのに品質が悪いものもいくらでもあります。

個人的には、分散環境を企業ユースに適用することで、実はいろいろ変えられるのではないかと思っているので、どのような「道具立て」になるかは二次的な問題でしかないです。AsakusaのHadoopへの「依存度」を見ればわかると思います。

いずれにしても、分散環境の適用の手段が増えた、ということでは歓迎していますよ。ポジショントークではなくてね。