富士通研究所と沖縄科学技術大学院大学(OIST)は10月12日、脳科学の最新の知見を活用し、人間のように応用力のある強化学習アルゴリズムを開発する共同研究を開始すると発表した。

近年、行動に対する報酬をもとに、試行錯誤を通じて環境に適応した行動選択方策をコンピュータに獲得させる強化学習が注目を集めるようになってきている。しかし、従来型の強化学習では、注目すべき情報をあらかじめ設計者が指定する必要や、問題ごとに学習をやり直す必要があるといった課題があり、実社会での適用は限られていた。

今回の共同研究では、人間の脳の学習方法に着目し、最新の脳科学の知見に基づいてそのメカニズムを取り入れることで、従来の強化学習で人手により調整していた部分もAIが自律的に調整できるようにする、応用力のある強化学習アルゴリズムの開発を目指すとしており、主に実用化に向けた課題の中でよりニーズの高い以下の3つの分野における技術開発を進めるとしている。

  1. 動的に変化する大量データの中から強化学習に適した情報を自動的に抽出する技術
  2. 過去の経験を別の問題の行動選択方策へと生かす転移学習技術
  3. 複数の方策から状況に応じて行動を選択する協調・並列強化学習技術

今後、OISTでは脳科学の観点から神経計算機構の数理モデル化を行い、強化学習アルゴリズムへ適用していくとするほか、富士通研究所は、最適化、制御工学の観点からアルゴリズム考案に参加し、同時に、計算資源を最大限活用する実装手法の開発を行っていくとするほか、こうした共同研究の成果を活用して、ICTシステム管理、エネルギーマネジメントなどの実社会での応用において、人手による設定・調整なしで、環境に適応した方策をより効率的にコンピュータに獲得させるAIソリューションの開発を目指すとしており、将来的には富士通のAI技術「Human Centric AI Zinrai(ジンライ)」の核となる新技術の開発につなげたいとしている。

今回の共同研究における成果のイメージ