NECは8月18日、ビッグデータの高精度な予測分析に必要な期間を従来比約3分の1に短縮する「特徴量自動設計技術」を開発したと発表した。
ビッグデータに対して高精度な予測分析を行うためには、対象データが分析に大きな影響をおよぼす条件を発見し、条件に当てはまるデータである「特徴量」の生成手順を設計するとともに、データの生成・評価を行い、これらの一連のプロセスを繰り返す必要がある。しかし、「特徴量」の設計には高度なデータの相関分析や、人手による実験・検証が必要なため、従来は専門知識をもつデータ分析技術者が手動で設計を行ってきた。例えば、ビールの売上予測では、特定の気温を上回った場合に売上が大きな影響を受けるが、データ分析技術者は、売上と気温データからこのような関係性を発見し、売上に影響を与える特定の気温データ(特徴量)を生成・評価することで、高精度な分析・予測結果を算出してきた。
今回NECが開発した技術は、この「特徴量」の生成にかかるプロセスの自動化を実現する。具体的には、分析対象となるビッグデータに対して、データ変換の組み合わせを高速に探索する「高速アルゴリズム」によりデータ分析に有効な「特徴量」を自動的に算出する。また、「特徴量」の算出において「標準化」、「移動平均」などデータ分析技術者の「データ変換処理」のノウハウをライブリ化することで、多様な特徴量を簡単に生成することが可能となった。
同技術を用いて行った実証実験で、ビルの電力需要を予測したところ、事前のデータ処理からビッグデータに混在する多数の規則性を発見する「異種混合学習技術」による分析・予測までの全体期間を、分析技術者が設計した場合に比べ、同等の精度で3分の1まで短縮することができた。これにより、大量のデータを分析する必要のある小売店舗の商品別の予測分析などを、従来以上に素早く・タイムリーに提供することが可能になる。
NECは同技術を2015年度中に実用化するとしている。