AIの「アルファゼロ」が３つの盤ゲーム最強ソフトを打ち破る

米グーグル傘下の英国AI(人工知能)ベンチャー企業ディープマインド社の最新ソフト「アルファゼロ」が囲碁、将棋、チェスの3つの盤ゲームをマスターし、それぞれのゲームで最強とされるソフトを打ち破ったと、同社は7日発表した。「アルファゼロ」は膨大なデータなしに「強化学習」と呼ばれるコンピューター自身の独学で学ぶ手法が取り入れれており、AIの進歩が著しいことを物語っている。論文は６日付米科学誌サイエンス電子版に掲載された。

ディープマインド社が開発した「アルファゼロ」の成果を示すイメージ画像（提供・ディープマインド社）

「アルファゼロ」がチェス、将棋、碁のそれぞれ最強ソフトと対戦したイメージ画像（提供・ディープマインド社）

「アルファゼロ」は同社の最強囲碁ソフト「アルファ碁ゼロ」が他の盤ゲームにも使えるようにディープマインド社が昨年末改良した。同社の発表によると、「アルファゼロ」はチェスの最強ソフト「ストックフィッシュ」との1000回の対戦では、引き分けも多かったが155回勝ち、負けたのは6回だけだった。将棋ソフト「エルモ」にも9割以上の勝率。囲碁では“先輩”の「アルファ碁ゼロ」にも対局の６割で勝ったという。

ディープマインド社は、コンピューターが人間の神経細胞を模した多層構造のネットワークを使って自動的に学習する「ディープラーニング(深層学習)」と呼ばれる技術を使った囲碁ソフト「アルファ碁」を開発。2016年1月にプロの棋士を相手に勝利したと英科学誌ネイチャーに論文を発表して話題になった。同社はその後、囲碁のルールだけを教えた後は棋士による膨大な対局データなしに「強化学習」で「勝つ手」を自分で学ぶ最強の囲碁ソフト「アルファ碁ゼロ」を開発し、昨年10月に「アルファ碁」に100戦全勝した、と発表している。

「アルファゼロ」は囲碁における「アルファ碁ゼロ」同様、囲碁、将棋、チェスのどれでも基本的にはルールを教えられるだけなので最初は無手勝流に自己対戦を繰り返すが短時間で最強ソフトに成長する。今回の成果は、膨大なデータを必ずしも必要としないAIの可能性を示すもので、同社はプレスリリースの中で「現実の世界のさまざまな問題を解決できる知的なAIのシステムを作るために、柔軟性を持ち、新しい状況に一般化する必要がある。今回の成果はこの問題を克服する重要なステップだ」としている。

関連記事

「アルファ碁が進化した最新囲碁ソフトが誕生対局データなしに独学で最強に」

「人工知能碁が世界トップに4勝1敗人間棋士も健闘」