NECは、ベクトル型コンピュータに適した、機械学習を高速実行するデータ処理技術を開発したことを発表した。
AIの一手法である機械学習技術を用いて大規模なデータを分析する際、複数のサーバを接続したクラスタと呼ばれるハードウェア環境で、Sparkなどのミドルウェアを用いて分散処理を行うのが一般的となっている。しかし、データ量が膨大な場合、処理性能が追い付かない、あるいは多数のサーバを要するためのコストがかかるという課題があった。
NECは今回、大規模な機械学習でよく用いられる「疎行列」というデータ構造に着目した演算技術と通信技術を開発することで、機械学習においても、ベクトル型コンピュータが持つ性能を最大限に発揮した高速実行を実現した。
また、機械学習を行う各種プログラムから同技術を容易に利用できるミドルウェアを開発した。同ミドルウェアはSparkやPythonから、これらが提供する機械学習ライブラリと同じ形式で呼び出すことが可能で、これらのライブラリのユーザは特別なプログラミングなしで使用できる。
これにより、例えば、Web広告出稿の最適化やレコメンド、文書分析の分野で分析が短時間で行えるようになるため、タイムリーに結果を利用できるほか、少数のサーバにより低コストな分析が可能になるため、大企業以外にも幅広いユーザ層で大規模なデータ分析が可能となる。
また、同社は次世代ベクトル型コンピュータの開発を行っており、幅広い価格・性能レンジで提供する予定だという。同技術を適用することで、従来ベクトル型コンピュータが得意としてきた数値計算領域に加え、機械学習などの大規模データ分析を対象とした領域へもその活用を拡大していく考えだ。
なお、NECは、同技術を、7月3日~6日にオーストリア・インスブルックにて開催されている「International Symposium on Parallel and Distributed Computing」において、5日に発表する予定となっている。