ClouderaのHadoopをエンタープライズ・データ・ハブにするという考えは大胆ですが、現実は大きく異なります。 Hadoopが他のビッグデータ・ソリューションを凌駕するのは、まだまだ先の話です。
大きなハンマーがあれば、すべてが釘に見えます。これは、Hadoop 2.0が直面する多くの潜在的な問題の1つです。Cloudera社は、Hadoop 2.0をあらゆる釘に対応できる万能ハンマーにする予定です。
これは素晴らしいことですが、実現可能性はどうでしょうか?ビッグデータへの取り組みが間に合わず、巨大なデータファームの適切な場所を見つけ始めたばかりの組織にとって、この種のハブはあまりにも遠い存在です。このような「データサイロ」をHadoop設備に取り込むのは容易ではありません。
Hadoopもかなりの障害ではありますが、このアイデアに対する最大の障害はHadoopそのものではありません。Strata-Hadoopカンファレンスでベンダーやユーザーと話したところ、ベンダーやユーザーはHadoopを、完全に機能させるためにはまだハンダ付けが必要なバケット部品の束としか見ていないことが明らかになりました。
Hadoopの機能のほとんどは、サードパーティを通じて実装されています。これらのサードパーティは、ClouderaやClouderaのライバルであるHortonworksだけでなく、Microsoft、Amazon、SoftLayer、Rackspaceなどのクラウドサービスプロバイダも含め、Hadoopの機能を即座にデプロイするタイプに提供しています。PuppetやPythonスクリプトはオプションであり、必須ではありません。
小規模なデプロイメントであっても、Hadoopの可動部分や鋭利なエッジの絶対数は非常に威圧的です。パネルでは、オラクル・プロダクト・マネージャーのDan McClary氏が、オラクルがHadoopツールの作成に費やした労力について説明しました。McClary氏は、Hadoopのバリや欠陥は、コミュニティとベンダーの協調的な努力によって、時間の経過とともに平滑化され、解決されていくだろうと述べました。
新しいHadoopベースのインフラであるYARN(Yet Another Resource Negotiator)はこれまで以上にオープンですが、アプリケーションはその上で動くように書き直さなければなりません。しかし、アプリケーションはその上で動くように書き直さなければなりません。例えば、アプリケーションをフレームワーク内のある種の仮想化ラッパーに自由に追加することができますが、これも簡単な作業ではありません。
業界では、Hadoop を既存のアプリケーションでよりうまく機能させるために、コネクタやデータファネルの開発など、さまざまな取り組みが行われています。既存のアプリケーションはいずれ Hadoop に移行するだろうという意見にはほとんどの人が同意していますが、既存のアプリケーションを Hadoop に移行するという問題に焦点を当てたワークショップはほとんどありません。ほとんどの人は、既存のアプリケーションを破棄して最初からやり直すのではなく、既存のアプリケーションを Hadoop に移行したいと考えています。
とはいえ、O'Reillyカンファレンスでの活動のレベルは、これがどれくらい早く実現するかを示す大きな前兆です。2014年の今頃には、このカンファレンスはニューヨークのマンハッタンにあるJavitsコンベンションセンターで開催されており、その時のClouderaの発表の中には、あまり楽観的なものを感じさせないものもあるかもしれません。現在のトレンドは、既存のビッグデータシステムを補完するものとしてHadoopを使用する方向であり、既存のビッグデータシステムのアップグレードシステムとしてHadoopを使用する方向ではありません。