Hadoopプログラミングフレームワークは「ビッグデータ」ムーブメントの代名詞かもしれませんが、FacebookのアナリティクスディレクターKen Rudin氏によると、企業が大量に保存された非構造化情報からビジネスインサイトを導き出すために必要なツールはそれだけではありません。
「Hadoopはテクノロジーですが、ビッグデータはテクノロジーの問題ではなく、ビジネスニーズの問題なのです。
「実際には、ビッグデータにはHadoopやリレーショナル・データベースなど、目の前のタスクに適したテクノロジーが含まれるはずです」。と彼は付け加えます。
Facebookのビジネスモデルは、10億人を超えるソーシャルメディア・ユーザーからのユーザー・プロフィールやアクティビティ・データを処理し、ターゲットを絞った広告を配信することに依存しています。しかし、「Facebookがやろうとしていることに対して、Hadoopは必ずしも○○○○ツールではありません。とRudin氏。
例えば、Hadoopでデータセットの広範な探索的分析を行うことは理にかなっていますが、運用分析のための発見を行うにはリレーショナル・ストレージの方が適しています。
Rudin氏は、Hadoopはデータセットの****レベルの詳細を見つけるのには向いていませんが、変換され集約されたデータを保存するにはリレーショナルデータベースの方が理にかなっていると述べています。
"結論は、どんなニーズにも適切なテクノロジーを使うこと"と語っています。
つまり、ビッグデータを分析するという行為自体が価値ある洞察をもたらすということです。「問題は、誰も尋ねていない質問に対して、より素晴らしい答えを導き出すことです。
フェイスブックは、統計学の博士号を持つだけでなく、ビジネスにも精通した、分析事業を運営する適切な人材の採用に力を入れています。
また、企業は「すべての人のためのアナリティクス」の育成にも努めるべきだとルーディン氏は言います。
フェイスブックでは、プロダクトマネージャー、デザイナー、エンジニア、財務担当者までが参加する「データキャンプ」という2週間のプログラムを社内で実施しています。「全員が参加することの意義は、問題や課題について議論するために使用できるデータの共通言語を全員に与えることです。と彼は言います。
フェイスブックはまた、統計家とビジネスチームの組織を揺さぶります。統計専門家が独立したままだと、彼らは積極的に行動するのではなく、「そこに座ってビジネスエリアからの要求を待ち、それに応える」ことになりがちです。しかし、統計専門家が事業部門に配置されると、"複数のグループが冗長に問題を解決しようとする "ことになります」。と彼は言います。
フェイスブックは「エンベデッド」モデルを採用し、アナリストをビジネスチームに配置していますが、より上級のアナリストにレポートすることで、重複作業を回避しています。