ビッグデータ "の概念が価値を高め、ホットデータ産業チェーンをもたらします。
IT経済社会の出現後、データはホットな関心事となっています。業界の視点から見ると、インターネットの急速な発展の10年間で、データ処理技術は日々変化しており、モバイルインターネットやモノのインターネット技術と新たな機会のビジネスモデルと相まって、データの生成速度を加速し、データストレージが爆発的に増加し始めました。ビッグデータ "の概念が生まれました。
しかし、「ビッグデータ」という概念の登場により、データ分析やデータ処理などのデータベース分野の技術はぬるま湯的な進化を続けてきました。データウェアハウスやBIといった新しい技術概念も生まれました。しかし、メディアの視点からは注目されませんでした。ビッグデータ "の概念の出現まで、最高点に全体のデータフィールドは、世界的な注目のホットな概念になります。
この現象については、呉信は言った:ビューとビジネスモデルの技術的な観点から、インターネットの出現は、伝統的な産業の運用を破壊している、皆の生活様式だけでなく、インターネットやモバイルインターネットでは根本的な変化を促進するために。誇大広告の概念の影響に加えて、それはデータ自体の価値を高めるために "ビッグデータ "の概念と言うことができます。データそのものはモデル化されていない、あるいは数値化する方法がありません。そのため、明確な価格をつけることができません。しかし、ビッグデータの推進力の下で、企業のデータに対する重要性はさらに高まり、データの価値とリソースの状況を見ることができるようになりました。
また、データウェアハウス、BIや他の初期の技術は、より積極的なアプリケーションの "ビッグデータ "によって駆動されます。次のビッグデータ時代は、人類の情報化社会の最終段階です。コンピュータ時代とインターネット時代は、ビッグデータ時代への道を開き、準備しています。コンピュータ時代の核心はコンピューティング・パワーで、人々のデータ処理能力を大幅に向上させました。インターネット時代は、情報の移動と接続の問題を解決しました。ビッグデータ時代は、世界中のあらゆるものをデータ化することができ、人々はデータの利用において実際の業務と行動を最適化し、グローバルシステムの運用をより効率的にすることができます。
ビッグデータ」の出現は、データ分野の急速な発展を促しただけではありません。この分野の開発者にとっては、最高の発展段階でもあります。
データアナリティクスの活用を阻む複数の要因
業界内では「ビッグデータ分析は金持ちのゲームだ」と言われています。
この発言について、呉信は自身の見解について次のように述べました。過去には、データウェアハウスに行くには、BIを行うには、それは多くのインプットのソフトウェアとハードウェアだけでなく、ハイエンドの人材を募集するだけでなく、多くの資金とエネルギーを投資する必要があることは事実です。しかし、インターネット産業の推進に伴い、データの生産スピードは加速し、データ分析・データ処理技術もますます完璧になり、ビッグデータ分析の敷居は徐々に低くなっています。その理由は主に3点。
- クラウドコンピューティングの出現
- オープンソースの威力は、インターネット技術の急速な発展によって浮き彫りになっています。
- 高度な技術を持つ人材が多数出現
時差のある競争、特殊な市場に直面する特殊製品
"千鳥競争"、専用市場に直面する特殊製品は、南大将軍の全体的な戦略的位置づけです。
南大将軍の設立当初、崔偉利会長はこのような戦略的アプローチを提案しました。伝統的なデータベース市場では、IBM、マイクロソフト、および他のいくつかの大企業がほぼすべての市場シェアを占めていることを見て、極端に行ストレージ技術の分野では、技術市場は飽和に達しました。したがって、この場合、従来の市場でシェアを獲得することは困難です。しかし、データ分析の新興分野では、国際的な大手企業と同じスタートラインに立つことが可能であり、製品も市場でそれらを凌駕することができます。これは "千鳥競争 "と呼ばれるもので、特化したデータベースを作り、ニッチ市場に集中することです"
プロフェッショナルなデータベース製品として、NU Generalはストレージ方式にカラムストレージモードを採用しています。データの面では、集計、グループの増加、関連付けの実行が速く、大規模なデータ分析やデータ統計に便利です。IOの要件も大幅に削減され、データ圧縮率が高く、Bタイプの操作に適しています。アーキテクチャの面では、従来のデータベースの垂直アーキテクチャとは異なり、Hadoopのように水平方向に拡張可能であり、従来のデータと比較してコンピューティングパワーに明らかな利点があります。
過去20年間は、ほぼ1つのデータベースプラットフォームですべてのアプリケーションタイプを満たすことができました。しかし、データの種類が細分化されるにつれて、そのようなデータ処理モデルは次第にユーザーのニーズを満たせなくなり、より多くのボトルネックが発生するようになりました。現在に至るまで、データ処理とアプリケーションはセグメンテーションに向かうパターンを形成しており、ナンダジェネラルの戦略的アプローチの正しさを再確認しています。いわゆるセグメンテーションとは、ある種のデータやある種のアプリケーションに特化した処理技術を行うことです。データ分析の特定の分野に精通し、特殊な市場に直面する特殊な製品は、異なるニーズに応じて、異なる製品を行います。
#p#
専用データベース製品:分析データベース GBase 8a
GBase 8aはNanda Generalの最も投資された分析データベース製品であり、カラムメモリ、インテリジェントクエリ、高効率圧縮、双方向並列、適応的最適化などの多くの新技術を採用し、これまでの性能向上はデータベースの容量を増やし、多くのインデックスを構築することでしか達成できないというルールを破り、GBase 8aは高性能と高いデータ圧縮率を両立しています。
呉新指摘:"ユーザーの実際のテストの後、典型的な分析アプリケーションでは、表示:1、費用対効果:ほとんど高いパフォーマンスを達成するために調整する必要がない、どのようにインデックスを構築する方法を考慮する必要はありません、どのようにパーティションやその他の問題。2、高性能:バッチ集計、統計性能の国際的な伝統的なデータベースと比較して、すなわち、クエリのパフォーマンス、ファジィクエリのパフォーマンスなど、数倍から数十倍の改善がある、3、高いユーザビリティ:インストール、チューニング、メンテナンス、および拡張は非常にシンプルで使いやすいです。"
ユーザーがHadoopプラットフォームの問題を解決するための非構造化データ処理技術の追加
数十年にわたる情報技術の発展を経て、伝統産業のユーザーは大量のデータを蓄積してきました。その中でも、構造化データが大半を占めています。ERPなどの各種システムで生成されるデータも、基本的には構造化データです。しかし、近年、半構造化データと非構造化データの数が急速に増加しており、特に半構造化データの数が急増していることは困難ではありません。
Hadoop分散コンピューティングプラットフォームは、その高い信頼性、高いスケーラビリティ、その他膨大なデータを扱う上で多くの利点があることが広く認知され、合意されています。Hadoopはクラウドコンピューティングプラットフォームとして、1台のPCのコンピューティングパワーが弱いという問題を解決するために登場し、同時に数百台、数千台のPCに強力なコンピューティングパワーを提供することができます。企業においては、ETLツールとして、膨大なデータを扱う上で非常に明白な利点があります。従来のデータベースでは不可能です。また、複雑なデータモデルのマイニングや予測モデルの計算においても、圧倒的な地位を占めています。しかし、その利用プロセスにはまだ一定の問題があることも否定できません。これは、南大通がこのような製品を組み合わせながら早急に解決しなければならない問題の一つでもあります。
南大将軍の多くのユーザーは、すでにデータ処理にHadoop技術を使用しようとすると、いくつかのプロジェクトの実験を実施し始めています。このような優れたプラットフォームを前にして、やるべきことは2つあります。1つ目は、Hadoopプラットフォームを企業化することです。Hadoopの企業化とは、Hadoopプラットフォームをユーザーがより便利に使えるようにすることです。2つ目は、技術のアップデートと、安定した利用環境を求めるユーザーとの矛盾を解決することです。"
汎用データベースの開発を堅持し、新技術適用の実践を開始。
そのため、国内データベースは汎用データベース市場への投資を続けながら、次世代の新技術の開発に努め、新しいデータ分析分野で独自の領域を開拓し、熾烈なデータベース市場で独自の市場セグメントを切り開くことが、自己市場競争力を強化し、自社の現状を改善するための最良の選択です。




