企業の情報基盤は、サーバ/クライアントの第2世代から、「第3のプラットフォーム」と呼ばれる時代へと変革しようとしている。この次世代の基盤を担うキーワードとして、「クラウド」「モビリティ」「ソーシャル」そして「ビッグデータ(アナリシスとも)」が挙げられている。 特にビッグデータは、これまで注視していなかったデータから新しい価値やチャンスを見いだせるようになるものとして、注目されている分野だ。この潮流に乗り遅れまいと、多くの企業がさまざまな取り組みを行っている。

そのビッグデータはほんとうのビッグデータ?

INTHEFORESTの代表取締役社長兼CTOを務めるITアーキテクトの冨田和孝氏は、ビッグデータとして活用しようとしている"それ"は「ほんとうにビッグデータなのか、見つめなおしてほしい」と警鐘を鳴らす。同氏は、これまでの経歴の中でさまざまなシステムに触れ、世の中に知らないデータベース技術はほとんどないと言われるエンジニアだ。

INTHEFOREST 代表取締役社長兼CTO ITアーキテクト 冨田和孝氏

「一般的に想定されているデータ量は、ビッグデータとしては小さすぎるのではないでしょうか。例えば、私は7年前、ある企業で10億レコードのRDBMSを運用していましたが、システムが悲鳴を上げるほどの状態でした。しかし、ビッグデータと呼ばれる領域は、この程度の"小さな"データではありません」(冨田氏)

例えば、Twitterが処理するデータ量は2010年の発表で1日あたり12TB、Facebookは2012年の発表で1日あたり500TBものデータを処理しているという。一定期間には、PB(ペタバイト)級のデータが蓄積されることになる。7年前に日本の一企業が10億レコードのデータを取得していた状況を考えれば、一般企業であっても、現在そして将来的にはもっと多くのデータを扱うことになるだろう。現状のRDBMSでは、即時に破綻してしまうほどのデータ量だ。冨田氏は、このような巨大なデータを分析し、活用するのが「ビッグデータ」であると主張する。

なぜビッグデータ分析にはPB級データが必要なのか、
またそのために必要なシステムとはなにか・・・

『データベースのプロフェッショナルが語るApache Cassandraの魅力』のホワイトペーパーを無償配布中


本稿で紹介している、INTHEFOREST株式会社による『データベースのプロフェッショナルが語るApache Cassandraの魅力』のホワイトペーパーを無償で配布しています。

「ビッグデータとして活用しようとしている"それ"は「ほんとうにビッグデータなのか、見つめなおしてほしい」
10億レコードではなくPB級のデータ運用を考えている方などに最適。
⇒続きはこちら

[PR]提供:ホワイトペーパー