NTTデータは、9月27日に発表済みの「米Twitter社とツイートデータ提供に関するFirehose契約」に基づくTwitterデータ提供サービスを、12月上旬より順次開始すると発表した。

NTTデータは、米Twitter社と締結した契約において、同社が提供するAPI「Firehose」を通じて取得・蓄積した、日本語のツイートデータおよび日本国内で書き込まれたすべてのツイートデータを提供できる権利を取得しており、本契約に基づき、NTTデータは公開APIよりも大量・高精度・高付加価値なツイートデータを提供可能なサービスプラットフォームを開発し、サービスを開始することとなった。

Twitter社の提供する公開APIでは、時間当たりのアクセス制限があるためキーワードで検索してもすべての情報が取得できないことがあり、また過去にさかのぼって情報を取得できる期間も短く制限されているため、過去データとの比較ができないことなど、取得できる情報に制限があった。

しかし、本サービスを利用することで、上記利用制限にかかわらず、日本語および日本国内で投稿されたすべてのツイートにアクセスすることが可能となる。これにより、ソーシャルメディア関連のビジネスを行う事業者は、Twitter社が提供する公開APIの制限を超えたデータを利用でき、より高精度なサービスの提供が可能になる。

サービス提供イメージ

例えば、ユーザー企業は自社のリサーチシステムやCRMシステム、BI/BAシステムにツイートデータを直接取り込んで分析することが可能となり、ユーザ企業のデータとTwitterデータを直接組み合わせた、より深い情報分析が可能となる。

また、検索基盤としてプリファードインフラストラクチャーの「Sedue(セデュー)」を採用、情報分析基盤としてNTTの研究所である、ソフトウェアイノベーションセンタとプリファードインフラストラクチャーが共同で開発した「Jubatus(ユバタス)」を採用している。これらツールの採用により、高精度な検索や情報分析が提供可能となる。

ツイートデータに付加情報を付与することで、より高い付加価値を生み出す。例えば、Jubatusを活用して投稿者の性別等プロフィール情報をツイートデータに付与し、プロフィール分析を可能にする。また、自然言語処理エンジン「なずき」を活用することでツイートの中にあるトピックの抽出や、ポジティブ・ネガティブなどの情報が付与されることで、言語処理エンジンを持たなくても投稿内容の詳細分析ができる。これらはあらかじめ決められた情報の付与だけでなく、顧客の要望に応じた新しい情報の付与も可能とする予定。

サービス体系と提供価格、提供開始時期は次のとおり。

サービス体系と提供価格、提供開始時期