NoSQLはビッグデータのストレージ問題の解決策として賞賛されています。SQLやその他の一般的なリレーショナル・データベースは、ストレージの制限や柔軟性に欠けるプロセスのため、非構造化ビッグデータを扱うことができません。一方、NoSQLは、無制限にデータを保存でき、変化するデータ・アーキテクチャに対応できるため、支持者から広く称賛されています。しかし、NoSQLはこれまでの分析手法に取って代わるものではありません。新しいタイプのデータがもたらす新たな問題に対処することに特化したアドオンツールなのです。
かつては、ある時点で組織にとって重要なデータを選び、それ以外は捨てなければなりませんでした。今日、企業は、将来的に貴重になる可能性のあるビッグデータを手放したくありません。NoSQLを利用すれば、将来の使用のためにすべてのデータをコスト効率よく保存することができます。
以下の3つのステップに従って、ビッグデータの価値をさらに実証してください:
1.データを理解する多くの場合、手元には多くのデータがあり、必要なものもあれば、使い道がないものもあります。データが異なるソースから来ている場合でも、データセット間の関係を理解する必要があります。リードタイム・アーキテクチャ "手法は、データセット間の関係を理解する必要がないという意味ではありません。その代わり、2つ以上のドキュメントやデータセット間のネストされた関係や結合された関係を特定し、修復する必要があります。この時点では、有効な初期結果を得るために、分析に重要な属性はできるだけ標準に準拠する必要があります。
3.データの変換データが有用であると考えるのであれば、綿密な処理を行い、データ研究者だけでなく幅広い分析者が利用できるように準備しましょう。必要な変換、正規化、クリーニングを手作業でコーディングすると、通常時間がかかり、持続可能ではありません。複雑なデータやNoSQLデータベースのデータなど、さまざまなデータソースを扱うにはツールを使うべきです。そして、それらをユーザーが読める有用な情報に変換します。
金鉱を探すようなものです。オンスの金を見つけるためには、何トンもの土を掘り起こさなければなりません。無駄な「汚れ」をふるいにかける強力なエンジンを持ち、関連するビジネス課題を特定するために創造性を発揮し続ける限り、貴重な「金」を見つけることができるのです。





