NECは8月18日、ビッグデータの予測分析における事前のデータ処理を行う技術として、予測に役立つ特徴的なデータ(以下、「特徴量」)の生成と、その評価を自動化する「特徴量自動設計技術」を開発したと発表した。

新技術は、同社が開発したビッグデータに混在する多数の規則性を発見する「異種混合学習技術」による分析を行う前に、従来、高度なノウハウを持つ分析技術者が行っていた「特徴量」の生成に関する一連のプロセスを自動化するもの。

今回の技術を用いて実証実験を行った結果、事前のデータ処理から「異種混合学習技術」による分析・予測までの全体期間を従来比約3分の1に短縮できたという。これにより、大量のデータを分析する必要のある小売店舗の商品別の予測分析をタイムリーに提供することが可能になる。

同社は今回、分析対象となる大量のデータに対して、「データ変換処理」の膨大な組み合わせの中から、最も適切な組み合わせを高速に探索する「高速探索アルゴリズム」を開発、これによりデータ分析に有効な「特徴量」を自動的に算出することを可能にしている。

また、特徴量の算出において、「標準化」、「移動平均」(時系列データの平準化)など、データ分析技術者がこれまで多くの経験を通じて培ったさまざまな「データ変換処理」をライブラリ化した。同ライブラリを組み合わせると、多様な特徴量を簡単に生成することできる。

同技術は2015年度中に実用化される予定。

「特徴量自動設計技術」の仕組み