組織がビッグデータにますます注力する中、安全な「サンドボックス」テスト環境でデータ処理やクエリ機能を試す能力は、IT部門とエンドユーザーの双方にとって重要です。しかし、安全で適切なビッグデータのサンドボックス・テスト環境を構築することは、トランザクション・データやレポーティングのための従来のテスト環境を構築することとは異なります。以下は、Transworld Dataの社長であるMary Shacklettがまとめた、サンドボックスプロジェクトを実施するための10の注意点とリストです。
1.データマートかマスターデータベースか?
データベース管理者は、テスト用サンドボックスで本番環境で使用するメインデータベースから直接取得したデータを使用するのか、それともこれらのデータをテスト専用の別個のデータマートに複製または除去するのかを、早い段階で決定する必要があります。フルデータベースの利点は、本番環境で実際に使用されるデータをテストできるため、テスト結果がより正確になることです。デメリットは、本番環境とデータが競合する可能性があることです。データマート戦略では、本番データとのコンフリクトのリスクはありませんが、本番データと同期させ、より本番環境に近づけるために、データを定期的に更新する必要があるかもしれません。
2.プログラム
スケジューリングはビッグデータサンドボックスのイベントで最も重要なことであり、これは全てのサンドボックスのオペレーションが***の状態で実行されることを保証します。IT部門にとってこのプロセスで重要なことは、サンドボックスを利用する様々なユーザーとじっくり話し合うことです。そうすることで、全員がスケジューリングについて前もって理解し、その根拠やいつ作業が実行されるのかを明確にすることができます。
3.制限の設定
特定のデータマートやサンドボックスを使用しないまま数ヶ月が経過した場合、ビジネスユーザーとIT部門は、これらのリソースをサニタイズするための許容可能な戦略を持つ必要があります。このテスト環境は、本番環境と同様に効果的に管理し、リソースがアクティブに使用されているときにのみ呼び出されるようにします。
4.純粋データの使用
ビッグデータパイプラインを使用する前提条件として、データを準備し、データマートソリューションを適用する際に、データがテストに使用できる品質を持っていることを確認できるように、データを浄化する必要があります。不完全、不正確、あるいは破損したテスト環境でデータを使用するのは悪い習慣です。このような悪い習慣を捨てることを学んでください。
5.リソースの監視
ビッグデータリソースがデータセンター内で集中管理されていると仮定すると、IT部門はリソースのアクセス許可を設定し、サンドボックスの使用状況を監視する必要があります。定期的に注意深く観察する必要がある問題の1つは、サンドボックス活動に参加するエンドユーザー部門が増えるにつれて、過剰プロビジョニングの問題につながる可能性があることです。
6.プロジェクトの重複への注意
ある時点で、会社全体で進行中のさまざまなサンドボックス・プロジェクトを追跡調査し、重複や冗長なプロジェクトがないことを確認する「監督委員会」を設置する必要があるでしょう。
7.コンピューティング・リソースをIT部門に引き渡し、集中管理するようにします。
ビッグデータ・プロジェクトを実施し、特定の部門数からスタートした後、すぐにビッグデータに対応できないことに気づき、コンピューティング・リソースの管理という日々の機能的な仕事を自分たちで行うようになる組織もあります。最終的には、機器をデータセンターに移し、IT部門に管理を任せることになります。そうすることで、ビッグデータが価値をもたらすビジネスに集中することができます。
8.ビッグデータチームの立ち上げ
サンドボックス化されたテストプロジェクトであっても、ビッグデータを扱う専門家からなるチームがタスクを支援することが重要です。通常、このチームは、ビジネスアナリスト、データサイエンティスト、ハードウェアとソフトウェアのリソースを最適化し、データベースの専門家と協力する能力を持つITスペシャリストで構成されるべきです。
9.ビジネス価値目標を忘れずに
サンドボックスプロジェクトに革新的なアイデアを取り入れるときは、本来のビジネス価値の目的を完全に忘れてはいけません。
10.ビッグデータサンドボックスの定義の明確化
エンドユーザー組織の参加者の多くは "サンドボックス "の意味を知りません。初期のサンドボックスのように、ビッグデータサンドボックスはビッグデータ関連の実験のための自由な場であることを意図しています。この目的を持ったプロジェクトは、いつ、どこで、どのようにサンドボックスを使い、実験とテストを通じて組織に有意義で商業的に実行可能な結果をもたらすかといった、サンドボックス実験の基本的なルールに従うべきです。





