米Googleは5月15日(現地時間)、同社が独自に開発する推論向けプロセッサの最新モデル、、第6世代Cloud TPU「Trillium」を発表した。Googleによって発表されてきたGemini 1.5 Flash、Imagen 3、Gemma 2等のイノベーションに対応しているという。
Googleは自社サービスで用いるための推論専用AIチップを独自に開発しており、今回発表されたのはこの第6世代モデル。第5世代モデルの高効率チップ「v5e」比でピークコンピューティングパフォーマンスが4.7倍に達する高い性能を実現したとしており、HBMメモリの容量・帯域幅は2倍に。超大規模エンベディングを処理するための専用アクセラレータの第3世代モデル「SparseCore」が統合され、高度なランキングおよびレコメンデーションワークロードを高速に処理可能だという。
性能向上の一方、効率を重視したTPU v5eよりも最大67%以上エネルギー効率を引き上げた点も特徴。1つの高帯域幅・低遅延のポッド内で最大256個までスケールアップできるほか、Cloud TPUマルチスライスやTitaniumを活用することで数万個まで相互に接続することも可能だという。
第6世代Cloud TPU「Trillium」を搭載したインスタンスは今年後半から利用可能になるようだ。