ビッグデータやIoT(Internet of Things:モノのインターネット)が広く知られるようになってきた今日、これらを支える技術として、オープンソースのNoSQLデータシステム「Apache Cassandra」が注目を集めている。今回、Apache Cassandraのエバンジェリストであるアルベルト・トビー氏に、Cassandraを取り巻く現状などについて話を聞いた。

自身の経験からCassandra開発の道へ

Apache Cassandra エバンジェリスト アルベルト・トビー氏

Apache Cassandraとは、Amazon Dynamoの分散ハッシュテーブル(DHT)とGoogle Big TableのKVSという2つの特徴を併せ持つ分散データベースだ。トビー氏は、Cassandraの最大の特徴を「クラスタ内のノードがリング構造になっていること」と話す。

マスタ・スレーブ構成をとっている従来のデータベースを拡張しようとすると、マスタのデータベースがシングルポイントになるが、リング構造のCassandraはリニアに拡張することが可能だという。さらに、「マシンも高スペックなサーバを用意する必要がなく、廉価なサーバを増やすことでリーズナブルに拡張していくことができる」とトビー氏。

また、マスタがない分散システムであるCassandraではすべてのノードが同等で、障害が発生した際も迅速に対応が可能だ。

ちなみに、Cassandraはオープンソースのソフトウェアではあるが、その開発はCassandraの商用版を提供しているDataStaxが中心に進めている。実は、トビー氏もApache Cassandraのエバンジェリストでありながら、DataStaxの社員でもあるのだ。DataStaxは分析・自動化に関する機能や管理ツールのフルバージョンを付加した形でCassandraを販売し、サポートも提供している。

トビー氏はApache Cassandraのみならず、LinuxカーネルやHTML5など、さまざまな技術に詳しいそうだが、多くのオープンソース・ソフトウェアの中から、なぜCassandraを選んだのだろうか。

この問いに対し、「Cassandraは運用管理が容易で、Webサイトの運用管理者をやっていた時、Cassandraの信頼性の高さと使いやすさに驚いた。開発に関わることで、運用管理者をもっとサポートしていきたいと思ったから」と、トビー氏は答えた。

ミッションクリティカルなビジネスに多数採用

ビッグデータ時代の到来とともに、Cassandraの商用版「DataStax Enterprise」は、さまざまな業種の企業で導入が進んでいる。Netflix、eBay、ウェザーチャンネルなど、いずれも膨大なデータをもとに大規模なビジネスを展開している企業ばかりだ。

例えば、映像ストリーミング配信を行っているNetflixは、抱えているデータの95%をDataStax Enterpriseに格納しており、数秒ごとにビデオ機器やオーディオ機器から情報を収集しているという。DataStax Enterpriseが1日に処理するトランザクションは1兆にも上る。同社は、世界各地に構える6つのデータセンターのOracle製品を置き換えたそうだ。

また、オンラインマーケットプレイスを展開するeBayは250TBのデータをDataStax Enterpriseに格納しており、1日当たり60億の書き込みと50億の読み込みを処理しているとのこと。

そのほか、ソニーのPlay Station 4のデータセンターにもDataStax Enterpriseが採用されているという。

日本でも利用が広がるCassandra

実のところ、トビー氏が来日したのは、今年11月に東京で開催されたイベント「Cassandra Meetup in Tokyo, Fall 2014」に参加するためだ。同イベントでは、同氏による講演「米国におけるCassandra最新事情」のほか、Yahoo! JAPANによる「Apache Cassandraへの取り組み」、ソフトバンクモバイルによる「CaaMS (Cassandra as a Message Store)」などの講演が行われた。

トビー氏に、同イベントの感想を聞いてみたところ、「日本にもCassandraのユーザーがたくさんいることに驚いた」という答えが返ってきた。まだ、Cassandraを使っていない人からも「自分たちで使ってみようと思う」というコメントをもらったそうだ。

トビー氏は日本に留学した経験もあることから日本語を話すことができる。また、日本のアニメに詳しく、特に宮崎駿氏のアニメが好きだそうだ。このように、日本に好意的な同氏は、これからもDataStaxの日本におけるビジネスに積極的に関わり、日本企業をサポートしていくと語る。

そして、トビー氏は「社会インフラが整備されている日本において、次世代のアプリケーションのデータベースとして、Cassandraが適していると思うので、ぜひ日本の企業も使ってみてもらいたい」と訴えた。

ビッグデータを解析できる環境が整いつつある今日、自社が抱えるデータをいかに有効活用できるかどうかが、企業の成功のカギを握っていると言っても過言ではない。

新たな技術を導入することは簡単なことではない。まずは、オープンソースのCassandraを試してみて、自社に適していると判断できたら、DataStax Enterpriseの導入に踏み切るという手もあるだろう。