東京ビッグサイトにて12月13日~15日にかけて開催されているエレクトロニクス製造サプライチェーンの国際展示会「SEMICON Japan 2023」にて、IBMは2023年10月20日に学術誌「Science」にて発表されたばかりのニューロモーフィックチップ「NorthPole」や、Rapidusに技術供与する2nmプロセスウェハなどの実物をデモを交えて紹介している。
ニューロモーフィックでAI処理の省電力化を目指すIBM
NorthPoleは2014年に発表されたニューロモーフィックチップ「TrueNorth」を拡張させたもの。この開発には日本アイ・ビー・エムでニューロモーフィックチップの研究開発に携わるメンバーたちも関わったという。ちなみに、もともと日本法人でもニューロモーフィックチップなどを始め、半導体に携わる人物は一定数居たというが、2023年にはRapidusの開発支援などもあり、その人員を大幅に拡充したという。
ニューロモーフィックはいわゆる脳型コンピュータとも呼ばれるもので、脳の神経構造を模すことで省電力ながら高性能な演算性能を実現しようという技術。脳は平常時で20Wほどで、数十PFlopsの演算性能を発揮できる超高効率のコンピュータとも言われており(しかも人間の脳波はガンマ波であっても80Hz程度と低い)、旧来のノイマン型コンピュータの制約を打ち破る可能性が長年にわたって指摘され、各所で研究開発が進められてきた。
NorthPoleはそうした取り組みの1つで、12nmプロセスを用いて開発されたニューロモーフィックチップで、12nmプロセス採用GPUや14nmプロセス採用CPUと比べて25倍高いエネルギー効率を実現したという。NorthPoleはこれから量産を進めていく段階だというが、同社のブースでは実際にPCIeカードとして動作しているデモを見ることができた。
また同社ブースではその応用発展版とも言うべきアナログ方式のAI推論チップ「Analog AI(アナログAI)チップ」も披露されている。同チップは、アナログ・インメモリ・コンピューティングとして、フェーズチェンジメモリ(相変化メモリ、PCM/PRAM)のコンダクタンスにニューラルネットワーク(NN)の重みづけを局所的に保存し、積和演算を行うことでメモリ内で演算処理を実現する手法を取り入れることで低消費電力ながら高性能演算を実現したもの。PCMはアモルファス相と結晶相の間の相変化を利用する不揮発性メモリで、古くはSTMicroelectronicsやIntelなどが設立したNumonyxや、Micron Technology(2010年にNumonyxを買収)とIntelによる3D Xpointメモリとして活用されてきた。アナログAIチップでは、アモルファス状態と結晶状態の間の連続した値をNNの重みとして記録することで実現しているという。
IBM z16のAI推論から派生した「AIU」
このほか、同社ブースではRapidusに技術供与が進められている2nm GAAプロセスの300mmウェハや、最新世代のメインフレーム「IBM z16」のプロセッサ「Telum」に搭載されている推論向け「統合AIアクセラレータ(AIU:Artificial Intelligence Unit)」をASICとして切り離した「AIU1」の紹介も行われている。
AIUはFP16、FP8、Int8、Int4、Int2に対応した32コアの推論用チップ。2ビット量子化による低消費電力でのAI推論を可能としており、同社によるとAIUカード1枚でハイエンドGPUの1/8の電力で済み、冷却用のファンも不要という低消費電力性能を提供できる(PCIeカードの仕様はヒートシンクのみ)。同社のWatsonと連携することで非言語系の推論にも対応でき、すでに同社のニューヨークの拠点にシステムとして設置され、稼働しているという。
また、AIU1は次世代としてHBMとの1チップ化を図るAIU1+やその先のモデルもロードマップとして予定されているとのことで、次々世代のAIUでは推論だけでなく学習にも対応できる予定だという。