日立製作所は12月26日、発生頻度の少ない事象の発生を高精度に予測し、その根拠を提示する人工知能(AI)を開発したと発表した。今後、日立グループ内に新技術のソースコードを公開し、日立グループ内の幅広い分野の事例を対象に効果検証を進めていく。

同技術の特徴として「偏ったデータや極端なデータに影響を受けないことを学習するシグナルノイズ学習」「AIによる予測根拠を説明しやすくする積和関数を用いた予測式の採用」の2点を挙げている。

シグナルノイズ学習に関しては、発生頻度の低い事象の場合は実績データが少ないため、特定の状況で偶然発生した事象にあわせてパラメータを調整(学習)してしまい、新しい状況で発生する事象に対して予測精度を下げる「過学習」の発生が課題だったという。

そこで、実績データを教師データとして使い、予測式のパラメータを調整(学習)する従来の学習機構に加え、意図的に間違った教師データを使う第2の学習機構を備え、両機構による学習を同時に多数回繰り返すアルゴリズムを開発した。

これにより、意味のないノイズによる影響を受にくく、より正確なシグナルを学ぶ学習が可能になるという。

積和関数を用いた予測式の採用について、従来のディープラーニングでは複雑な非線形関数を組み合わせた予測を行うのに対し、同技術では予測式に積と和による関数を多層化したネットワーク構成を採用した。

予測した結果を一般的な要因分解手法というMECE(Mutually Exclusive and Collectively Exhaustive)で構造化し、それぞれの要素の重み(影響度)を定量化することで「条件と条件Bと条件C,...が同時に成り立つ」という要因の組合せで根拠を説明可能にするという。

今回、同技術の効果を検証するため、過去の住宅融資への申し込み時のデータを用いて貸し倒れの発生を予測し実績と比較した結果、予測精度を表すAR(Accuracy Ratio)値において、従来のディープラーニングと比較すると43%高い精度で予測できるという結果が得られたという。