NTTデータは7月9日、米DataRobotと新たにデータパートナー契約を締結し、Twitter集計データサンプルの提供を開始したことを発表した。今回の契約によりNTTデータは、DataRobotで使えるようにあらかじめ加工したデータを一部無償で提供する。
従来、メーカーや小売・流通事業者を中心に、売れ筋商品の見極めや在庫管理を行うため、自社データ(出荷、販売などの実績データ)に基づいて需要予測を行ってきたが、消費者トレンドをタイムリーに把握するには消費者心理が強く表れるソーシャルメディアの情報が不可欠になってきている。しかし、実際にソーシャルメディア上のデータを予測モデルに組み込む課題として、データのクレンジング処理、自然言語処理、特徴量抽出などのデータ加工の前処理を行うための技術的なハードルや高い初期構築コスト、同時に社内と社外両方の大量のデータを使ったAIモデルの構築などを行う必要性があった。
今回の取り組みは、NTTデータが2012年から全量Twitterデータを扱っていることを踏まえ、DataRobotとNTTデータが新たにパートナー契約を締結することで、そうした課題の解決を目指そうというものだという。
具体的には、DataRobot利用企業は、DataRobotのデータ共有・自動特徴量生成機能を通して、DataRobot上でNTTデータが提供するデータサンプルを手軽に取得できるようになるため。従来課題とされてきたデータのクレンジング処理やコストの最小化を実現しながら、SNSデータを用いた需要予測モデルの検証が始められるようになるとする。また、自社内でAI予測モデルの精度向上に向けて効率的かつ、迅速に検証と評価を行うことも可能になるという。