ビッグデータ統合によってデータドリブン経営を実現することができるが、構造化データから非構造化データ、マシンデータに至るまで多様なデータタイプをサポートし、いま現在も増大を続けているデータソースにタイムリーに対応していくのは容易なことではない。この課題を克服し、Talend社の急成長の原動力となったのが、OSS(オープンソースソフトウェア)ならびに幅広い企業とのアライアンスを軸としたオープン戦略である。
汎用的なデータ統合ツールをオープンソースで
Talend株式会社 マーケティングディレクター 寺澤慎祐氏 |
基幹業務システムで運用されている「構造化データ」のほか、クリックストリームや消費行動をトレースしたデータ、FacebookやTwitterなどのソーシャルメディアで交わされているツイート(つぶやき)やコメントなどの「非構造化データ」、各種センサーやスマートメーターなどから生成される「マシンデータ(M2Mデータ)」、さらには政府や自治体、公共機関などから提供される、各種の統計データや気象情報、交通情報などの「オープンデータ」まで、社内外のデータを統合し、活用することでデータドリブン経営を実現できる。
とはいえ、多種多様なデータソースやデータタイプをサポートしなければならないビッグデータ統合は容易なことではない。
Talend社は、この困難なテーマにどうやってアプローチしているのだろうか。
まずは簡単に、Talend社の生い立ちから振り返ってみたい。2005年、ベルトランド・ディアド氏とファブリス・ボナン氏の二人によって、Talend社はフランスで創業した。同社の日本法人でマーケティングディレクターを務める寺澤慎祐氏は、このように語る。
「二人は共にデータの整備や正規化、ネットワークを介したアップロード/ダウンロードなどを専門とするエンジニアで、さまざまなシステムで似たようなプログラムが何度も繰り返し個別開発されている状況に疑問を感じ、汎用的なデータ統合ツールを作ろうと考えたのです。しかし、創業したばかりの会社はマンパワーが少なく、自分たちだけでテストやエンハンスを行っていくのは困難だったことから、そのツールをOSS(オープンソースソフトウェア)として展開することにしました」
4万5,000人のコミュニティメンバーが機能強化に貢献
このオープンイノベーション戦略こそが、その後のTalend社の急成長の原動力となった。
BI(ビジネスインテリジェンス)ツールのビジネスオブジェクツ社(現SAP)の創立者であり15年間CEOを務めたベルナード・リオトー氏。データ統合ツールのアセンシャル・ソフトウエア社(現IBM)の創立者としてCEOを務めたピーター・ジェニス氏。データ統合・分析ソリューションのパイオニアとして知られるIT業界の2人の有力者が、Talend社に出資するとともにボードメンバーに名を連ねたのである。
両氏を突き動かしたのは、「多種多様なデータを1つのツールで統合するのは、単独ベンダーの取り組みでは不可能。業界全体の共有資産となるオープンイノベーションならば、それを実現できる」という共通した思いだった。
事実、Talend社は2007年以降、売上ベースで毎年平均128%の成長を続けている。同社が開発したOSS版「Talend Open Studio」のダウンロード数は2,000万本を突破。そのうちの5%にあたる100万人がユーザーとなり、4,000社が有償の製品版を導入しているのだ。
そして注目すべきが、総数で約4万5,000人となったコミュニティメンバーだ。
「このメンバー数は、Linux、MySQL、PostgreSQLに次ぐ、世界第4位にランクされています。このうち品質テストに携わっているのは約1,500人で、データ統合分野のソフトウエアとしては極めて多い人数です。同等のマンパワーをかけた品質テスト体制を擁している商用ソフトウエアの開発ベンダーは多くはないはずです。ここにTalendツールの最大の強みがあります。高品質のソフトウエアを生み出し、短期間のサイクルで改善・強化することができるのです」(寺澤氏)
さらに、Talend社のオープン戦略は、ビジネス面でのアライアンスにも向けられている。これにより、TalendツールとさまざまなシステムやWebサービスとの接続をサポートするコンポーネントの数は、現在では500種類を超えるまでになった。
「Facebookや地図情報システムなど、データソースの増加とともにTalendツールのコンポーネントは種類を増やしてきました。今後も新しいシステムやWebサービスが登場すれば、その接続コンポーネントが開発されます。大規模なコミュニティがバックにあるからこそ、Talendツールはこうした動きに俊敏に追随していけるのです」(寺澤氏)
あらゆるプロセスでデータを一元管理“唯一の真実”を実現
こうしたオープン戦略で発展してきたTalendツールには、現在どんなポートフォリオが用意されているのだろうか。
Talendツールがカバーしているのは、「データの整備」「データの統合」「ビッグデータの統合」「アプリケーションの統合」「マスターデータの整備」「プロセスの統合」といった領域だ。検証利用や個人レベルのユーザーは、これらのすべてをOSS版として無償で利用することができる。
さらに、OSS版の上にスケジューラや共同開発、負荷分散、配備方法などの機能を実装した製品版として、部門やプロジェクトレベルで利用することを想定した「Enterpriseシリーズ」、全社や企業レベルで利用することを想定した「Platformシリーズ」が用意されている。なお、これらの製品版については、利用したい機能に応じてパッケージを選択する。
ただ、ここでのポイントは、複数のコンポーネントを寄せ集めたスイート製品としてTalendツールが成り立っているわけではないことだ。
「あくまでもコアモジュールは共通なのです。すなわち、同じインターフェースのもとで、データ整備からビッグデータ統合、プロセス統合まで、目的・用途に合わせた形でシームレスに機能を拡張していける仕組みとなっています。ですから、データ統合への取り組みの深さによってエンジニアや利用者のノウハウやスキルが無駄になることがなくシームレスにデータ活用の深度を深めることができるのです」(寺澤氏)
かつてBIツールが高い注目を集めていた黎明期に、大きな壁となっていたのが「Single Version of Truth(唯一の真実)」という問題である。
マーケティングや企画部門などのデータ分析の専門家、営業や経理などの業務部門、マネージャーや経営者など、それぞれの役割に応じたBIツールが導入されたのだが、元となるデータを取得したタイミングや集計方法が違っていたことから、導き出される結果に微妙な“ズレ”が生じてしまうのである。
もちろん、利用する部門や役職によって、KPIの表示方法や粒度の細かさを変えるなど「見せ方」を工夫する必要はある。ただし、あくまでも元になるデータ(事実)は唯一であるべきなのだ。それによって初めて、全社で同じ指標を共有し、整合性の取れたデータ分析によって共通の方向性を見出すことができる。
Talendツールは、根本的な仕組みによって、このSingle Version of Truthの問題を解消しているのである。ビジネスの現状の“見える化”からビッグデータ分析による将来予測、その結果に基づいたアクションの実施まで、あらゆるプロセスで元になるデータを一元管理し、鮮度や精度などの品質を維持することができるのである。