NECは7月10日、機械学習において、大量のデータが得られない状況でも活用可能な、複数の機械学習技術を開発したと発表した。

ディープラーニングを代表とする機械学習では、これまでデータ収集の初期段階や、データ収集コストが高い環境など、学習データが大量に得られない状況では、機械学習効果を十分に発揮できなかったが、今回開発した技術により、機械学習技術が活用できる場面を拡大することが可能となるという。

今回開発したのは、人のノウハウを取り入れて、学習効率の高いデータを能動的に収集して学習する技術、収集したデータをもとに、実世界の事象の複数のシミュレーション結果の類似度に基づいてパラメータの修正を自動で繰り返し、正しいパラメータを推定する技術、AIの分析結果に基づく意思決定時に、収集データを学習用と効果評価用に分割した複数パターンで効果を見積もり、少数データの偏りに影響されにくい意思決定を可能にする技術の3つ。

  • 開発した3つの技術

人のノウハウでは、専門知識を持つ人の物事の因果関係に関するノウハウ(肥料の成分と植物の育成の関係、等)を数値化して活用する。

パラメータの修正を自動で繰り返し、正しいパラメータを推定する技術では、パラメータ値の異なる複数のシミュレーション結果の類似度に基づいたパラメータ値の修正を繰り返して、正しいパラメータ値を推定する。

少数データの偏りに影響されにくい意思決定を可能にする技術では、収集したデータを学習用と効果評価用に複数の分割パターンを準備し、それぞれの効果評価結果を平均して、より正確な効果を見積もる。これにより、少数データの偏りに影響されにくく、より正しい意思決定ができるようになるという。

これらの成果の一部は、NEC-産総研人工知能連携研究室、国立情報学研究所、科学技術振興機構、統計数理研究所、Max Planck Institute for Intelligent Systemsとのオープンイノベーションによって得られたもので、NECは今回の成果について、機械学習技術に関する国際会議であるICML2018(International Conference on Machine Learning、期間: 2018年7月10日~15日、場所:スウェーデンのストックホルム)で発表する。