Teradata(テラデータ)という企業をご存じだろうか。1979年に米国で創業し、現在ではクラウドベースのデータおよびアナリティクス(分析)に特化したエンタープライズ企業である。
日本法人は日本テラデータとして活躍しているが、日本マイクロソフトなどグローバルIT企業と比較すると、日本での知名度はさほど高くはない。だが、Teradataが持つ潜在能力は実に高く、ポストビッグデータの時代を迎えた現在こそ注目すべき企業の1つに数えるべきだ。
今回は、米国日時の2018年10月14~18日にラスベガスで開催された「Teradata Analytics Universe 2018」を中心に、同社の戦略やソリューションをご報告したい。
データウェアハウスからデータインテリジェンスへ
イベント初日の基調講演では、50カ国3,000人以上が集まった会場の聴講者に対して、Teradataのビジョンが語られた。現在同社は1,200万ユーザーを抱えつつ、11兆のクエリを通じて840EB(エクサバイト)のデータが使われる状況下にある。そのようななか、講演ではTeradata COO, Oliver Ratzesberger氏が「パーベイシブデータインテリジェンスの新時代を切り開いていく」と述べた。
抄訳すれば『意思決定者のために加工・分析したデータの普及』。これが新たなTeradataを象徴するキーワードだ。同社は従来のDWH(データウェアハウス)企業から、ユビキタスなデータインテリジェンスを届ける企業に生まれ変わるという。イベント開催直前に発表した新たなコーポレートロゴにも同様のメッセージが込められており、その意思は登壇時の発言「アナリティクスを買うのはやめよう」(Ratzesberger氏)にも通じる。
Ratzesberger氏の発言は過去の自社を含めた旧態依然としたアナリティクスツールを否定するものだった。その理由は、パーベイシブデータインテリジェンスを実現するソリューション「Teradata Vantage(以下、Vantage)」の存在が核にあるからだ。Vantageの導入事例として、オーストラリアのQantas Airways Limited(カンタス航空)が成し得た燃料消費率1.5%の改善や、米通信キャリアのVerizon Communications(ベライゾンコミュニケーションズ)の月間解約率を1.2%で抑制したことを紹介。また、米国の非営利民間医療保険の最大手であるKaiser Permanente(カイザーパーマネンテ)は、Vantageを活用することで、年間に亡くなる12万5,000人の10%を救い、3,000億ドルの経費削減に成功したという。
Teradata President and CEO, Victor Lund氏は「現在のビジネスで求められるのは、保有するデータを容易に取り出して活用できる仕組み」だと述べる。多くの企業は蓄積したデータを古いシステムで管理し、データアナリストはデータコネクターを通じて分析前の処理を行うだろう。TeradataはVantageについて、「常にすべてのデータを管理するため、分析プロセスや展開先、分析による洞察を容易に得られる」と説明する。
Teradata Vantageで何ができるのか
TeradataはVantageのメリットとして「好みの言語やツールが使用できる」「分析関数とエンジンを単一化」「複数のデータセットをサポート」の3要素を得られると語る。「皆さんに適切なツールを使って頂きたい。Vantageは『適切なツールを適切な仕事に使う』という概念が背景にあり、データの形状や分析内容に応じて言語やエンジン、4D Analyticsなどを用いて、広範なビジネス課題を解決できる」(Teradata SVP of Marketing, Chris Twogood氏)という。具体的なSQLやPython、Rなどの開発言語、各種BIツールに加えて、SASやJupyter、RStudioといったプラットフォームで、JSONやBSON、AVRO、CSV、XMLといったデータを扱える。
また、すべてのデータをいつでも活用できるのがVantageが備える特徴の1つ。データをスピンアップし、必要な場面でダイナミックに分析できる場面が増えているが、従来のデータを読み込んで変換する過程はトラブルを引き起こす要因に数えられる。この課題に対してVantageはデータを1つのクエリで取得し、そのまま分析を実行するNative Object Storeの実現を2019年リリース予定の次期Vantageで容易にするという。データサイエンティストやビジネスアナリストはAmazon S3やAzure Blob上のデータをシームレスに処理できる。
データ分析の前のデータ準備に課題、全自動化で解決へ
イベントではほかにも著名な登壇者により、企業のデジタル化に向けた施策など多くの話題が語られたが、最後はTeradata VP of Technology and Innovation, Jacek Becla氏の発言に注目したい。同士は長年スタンフォード大学に在籍していたが、Teradataに席を移した理由の1つとして、「顧客視点でエンタープライズの仕事に携わっている。技術や分析エンジンに取り組み、具体的なソリューションを実現できる」と述べた。
Becla氏は主に研究的視点から技術に携わっているが、「データラングリング(飼育)とスキーマ設計に7割の時間が費やされる」と、分析に至るまでのデータ準備に多様な課題があると指摘した。その上で「速さや最適性といった議論ではなく、すべてを自動化する」(Becla氏)のがVantageの意義であると語る。前述したTwogood氏が述べたようにNative Object Storeの実装は来年以降だが、「単なるビジョンではなく、研究所には試作機もある。1つのクエリにデータを割り当て、PB(ペタバイト)級のクエリを実行できる」(Becla氏)と多様な分析に集中できることを強調した。合わせて機械学習に用いるGPUのマルチスケジューリングについて、解決策を検討しているとして、現在取り組んでいる研究成果もいくつか披露した。
今後の機能については実装後に機会があれば紹介したいが、強いて昨今のバズワードを用いれば、現在は「ポストビッグデータ時代」に突入している。大量のデータを処理するビッグデータプラットフォームは普遍化し、利用する企業側はもちろん分析ソリューションの提供側でも、データの集積方法や更新の容易性、アクセスの最適化が課題として挙げられてきた。これらの諸条件を解決するには我々の意識変革も伴うが、基盤となるデータ・分析プラットフォームの躍進は、課題解決の大きな近道となり得るだろう。
阿久津良和(Cactus)