日立製作所は12月25日、複数のAI(人工知能)を相互接続したAI群でビジネスを表現し、AI群同士がコンピューター上で自己競争を行うことで、人が用意した実績データに頼らずに学習を行うビジネス向けのAI技術を開発したと発表した。
新技術では、ビジネスに関わる企業をディープラーニングを用いたAIエージェントで表し、複数のAIエージェントを相互接続したAI群でビジネスを表現するという。各AIエージェントは置かれた状況を考慮して、お互いにモノや情報のやりとりを繰り返すことで、損失低減などの与えられたアウトカム(ビジネスにおいて向上させたい数値であり、問題に応じて人が設定する)の向上に有効なアクションを学習する。
学習する際には、AI群をコンピューター上に複数生成し、同時並行で学習を実行。そして、それぞれのAI群の全体のアウトカムを競わせる「自己競争」を何千回と繰り返すことで、より良いアウトカムを追求するとしている。同技術の特徴は「学習管理機能によりAIエージェントの学習を制御しAI群全体のアウトカムを向上」「学習モデルを交叉させることでより優れたモデルを生成しAIエージェントを進化」の2点を挙げている。
AI群全体のアウトカム向上については、同技術では相互接続した複数のAIエージェントのそれぞれの学習を管理し、各AIエージェントの学習が相互に悪影響を与えることを防止する学習管理機能を備えている。
同機能は、各AIエージェントの学習のタイミングの制御を担い、学習の初期段階では1つのAIエージェントのみに学習させ、徐々に学習するAIエージェントの数を増やしていくという。これにより、AIエージェントが同時に学習する時に生じる競合を避け、AIエージェント同士の協調を学習させることができ、その結果、AI群のアウトカムの向上につながるとしている。
AIエージェントを進化させる技術に関しては、AI群を構成するAIエージェントが何度も学習を繰り返すと、各AIエージェントの学習結果(モデル)が偏ることでAI群のアウトカムが個別最適の状態に陥り、アウトカムの向上が停滞する現象が発生するという。これを解決するため、コンピューター上に複数生成したAI群の間で、AIエージェント同士のモデルのパラメータを掛け合わせる(交叉する)ことで、新たなモデルを持つAIエージェントを生成し、新たなAI群を構築する。
新たに構築したAI群を含め、複数生成したAI群のアウトカムを比較し、アウトカムの劣るAI群は消滅させ、アウトカムが優れるAI群を残す処理(自己競争)を繰り返す。これにより、より良いアウトカムを追求できるとしている。
同技術の有効性を、サプライチェーン上の複数の企業によるビジネスを模擬した「ビールゲーム」で検証した。同ゲームでは、小売・卸売・仲卸・工場の独立した4つのエージェントが発注量をそれぞれ決め、サプライチェーン全体で在庫や欠品といった損失を最小にすることを競う。
これには、予測不能な需要変動の影響を常に受けることに加え、各エージェントは在庫や欠品などの情報を互いに共有せずに発注量を決めざるを得ない制約があるため、例えば囲碁のようなゲーム参加者間で状況を共有するゲームにはない難しさがあるとしている。
同ゲームで熟練者が自らの経験に基づいて発注判断を行った場合には、35週で平均2028ドルの損失を出したが、同技術を用いることで損失を489ドルまで低減できることを確認した。この結果は、ビジネスにおいても自己競争により学習するAIが有効であることを示しているという。
今後、同技術のソースコードを日立グループ内でグローバルに公開し、サービスや製品に組み込むことで、電力・エネルギー、産業・流通・水、アーバン、金融・公共・ヘルスケアなど、幅広い分野における社会イノベーション事業での利用を目指す。