Intelは6月4日、次期Coreプロセッサ「Lunar Lake」、データタセンター向けプロセッサ「Xeon 6」、AIアクセラレーター「Gaudi 3」の詳細な情報を公開した。これら製品で包括的にAI PCのリーダーシップを狙うとしている。台湾・台北市で開幕したCOMPUTEX TAIPEI 2024の基調講演にて、米IntelのPat Gelsinger CEOが発表した。
まず、今回のGelsinger CEOによる主な発表内容は以下の通り。
- Lunar Lake アーキテクチャ、CPU・GPU・NPUの詳細を開示
- Xeon 6はCPUコアが異なる「Xeon 6 P」と「Xeon 6 E」の2系統へ
- Gaudi 3は性能を引き上げつつ、価格でもNVIDIA対抗を強く意識
関連して現地では、それぞれの特にスペックやテクノロジーの内容をさらに掘り下げる個別セッションも実施されており、それらの内容は別途、すぐに追加レポート記事としてお届けするので、あわせて参照いただきたい。
Lunar Lake - NPUとGPUも世代交代、CPUはHT削除しIPC向上を重視
Lunar Lake(開発コード名)は、省電力で薄型軽量なノートPC、主に「AI PC」向けの次期Coreプロセッサで、従来のMeteor Lake「U」を置き換える。ゲームやAI性能が大きく向上しながらも、搭載ノートPCのバッテリ寿命は最大60%伸びるのだという。AI PCということで、目下、Snapdragon X Plusなどが直接の競合になってくる。
既報の通り、製品のリリース時期は今年2024年の第3四半期。AI処理の性能はTOPS(Tera Operations Per Second)の単位だと、CPU・GPU・NPUを合算したチップ全体で最大120 TOPS、NPU単体でもMicrosoftの「Copilot+ PC」の基準を満たす45 TOPS以上(最大48 TOPS)となっている。
なお、Lunar Lakeのチップ製造には、台湾の半導体受託製造企業であるTSMCの先端プロセスを使うという予測がでていたが、今回改めて公になったのは、CPU・GPU・NPUを含むコンピュートタイルがTSMCの「N3B」、I/O類が置かれたコントローラータイルがTSMCの「N6」で、これをIntelの3次元実装技術のFoverosを使って、ベースタイル(Intel P1227.1で、Meteor Lakeと同じ)に積層している。
SoCパッケージの基板上には上記のタイルのほか、メインメモリチップとして転送速度8.5GbpsのLPDDR5Xを2チップ、合計最大32GBの容量で実装している。メモリをオンパッケージとしたことは、省スペースと省電力にも寄与する。なお、COMPUTEX会場で確認できたLunar Lakeの実機サンプルには、サムスン製のLPDDR5X「K3KL3L30DM」のES品が搭載されていた。なお、Lunar Lakeにはメモリ容量が16GBのSKUも用意される。その際にメモリチップ数が変わるのか、であれば接続チャンネル数や帯域はどうなるのかなどは、取材時点では非公開扱いであった。追ってSKU情報が出てくれば判明するだろう。
CPUはP-core(Performance-core)に「Lion Cove」コア、E-core(Efficient-core)に「Skymont」コアのハイブリッド構成。Pコアが4基、Eコアが4基の計8コアだ。トピックとしては、今回のPコアからはHyper-Threadingがついに省かれた。Eコアとセットでスレッドのスケジューリングを空きなく最適化しているLion Coveに対し、HTを有効化すると使う電力や実装面積でかえって効率が悪くなるから、ということらしい。HTは電気的に無効化というわけでもなく、物理的に載っていない。
GPUはXe GPUの第2世代である「Xe2」を搭載している。これの開発コードネームは「Battlemage」だそうで、とりあえずAlchemistの次がちゃんと出てきたのはディスクリート派にも一安心かもしれない。Lunar LakeのXe2は、グラフィックス用のXe2 GPUコアとAI用のXMX(Xe Matrix Extension)からなり、GPUコアの性能は現行Xe比で1.5倍、XMXは最大67 TOPSの性能を持つとされた。
NPU(ニューラル・プロセッシング・ユニット)は、まずAI性能が48 TOPSと、Meteor Lakeの11.5 TOPS程度から実に4倍増。単純に、NPUの実装規模も3倍増しており、その時点でAI 性能をかなり重視していることがわかるが、世代してもMeteor Lakeに載っていたNPU 3720を「NPU 3」としたのに対し、Lunar LakeのNPUは「NPU 4」を名乗っていて、効率改善など内部に手が入っている。
Lunar Lakeでは総じて、AI PCとしての性能向上と、前世代のMeteor Lakeと比較して(メモリ含むSoCで)最大40%の消費電力を削減したという省電力性を推している。
Gelsinger CEOはLunar Lakeについてx86の互換性の優位も説明しており、「AIを民主化する」として、オープンスタンダードであることに利点が存在することと、これまでに築かれた強力なエコシステムによってAIを推進する機会が得やすいこともアピールしている。
AI PCではクアルコムやAMDなどが競合として活発に動き始めたことを意識してか、Gelsinger CEOは、「他社もAI PC市場へ参入を"準備"しているが、Intelは既に(Core Ultraなどによる)AI PCを大規模に展開している。Lunar Lakeは計画通り年末商戦に間に合わせる。20以上のメーカーが80機種以上のLunar Lake搭載AI PCを計画しており、今年全体では、4,000万個以上のCore Ultra搭載PCが出荷されることになる」と説明。同社が先行して業界の主導権を握るつもりであることを強調している。
Xeon 6 - PコアのみのXeon 6 with Pと、EコアのみのXeon 6 with E
続いて、6th Gen Xeon Scalableとはならず、製品ブランドの命名法則を一新して「Xeon 6」となったデータセンター、ネットワーキング、エッジ向けのXeonの次期製品について。
今回、Xeon 6700シリーズとXeon 6900シリーズの2グレードが発表され、それぞれにPコアのみの「Xeon 6 P」(開発コード名:Granite Rapids)と、Eコアのみの「Xeon 6 E」(開発コード名:Sierra Forest)をラインナップすることが発表された。なお、Xeon 6 EのXeon 6700シリーズ「Xeon 6700Eシリーズ」については本日より発売となる。Xeon 6 Pは今年の第3四半期より発売することも発表された。
Pコア(Performance-core)とEコア(Efficient-core)の両SKUにより、AI等のの高性能コンピュート・ニーズから、スケーラブルなクラウドネイティブ・アプリケーションまで、幅広いユースケースとワークロードに対応するという。両SKUをまたがって、共有ソフトウェア・スタックと、ハードウェアおよびソフトウェア・ベンダーのオープンなエコシステムによる互換性がうたわれている。
Xeon 6 Eは、高いコア密度ならびに物理コア数の多さと、電力比性能が特徴。高密度でスケールアウト型のワークロードに適しているとされる。性能は、2th Gen Xeon Scalableと比べると、同等性能ならラック数を1/3にでき、最大4.2倍のラックレベルの性能向上、最大2.6倍のワット当たり性能向上が可能とされる。
Gaudi 3 - NVIDIA H100を強く意識した性能と価格のターゲット
NVIDIAの独走を各社が必至に追うデータセンター向けAIアクセラレーターで、Intelが今年中の市場投入を発表している次期製品が「Gaudi 3」。今回は、このGaudi 3のAIキットの価格が発表された。
Gaudi 3は第5世代Tensor Processorを64基搭載し、Matrix Math Engineを8基統合、128GBのHBM2eメモリを組み合わせて3.7TB/sのメモリ間帯域を実現する。製造にはTSMCの5nmプロセスを使っている。従来の「Gaudi 2」比だと、FP8で2倍、BF16で4倍のAI演算処理性能を提供するほか、ネットワーク帯域幅を2倍、メモリ帯域幅は1.5倍に拡大している。
製品の提供形態はOAM(Open Accelerator Module)、OAMを8基搭載したユニバーサル・ベースボード、PCI Express(PCIe)カードの3種類を用意している。ほかOAMの冷却ユニットには空冷と液冷のオプションがある。
そして価格だが、Gaudi 3アクセラレーター×8基のユニバーサル・ベースボードキットで125,000ドル。これは「推定で、競合の同等プラットフォームの2/3のコスト」という。
この「競合」というのはNVIDIA H100と見られる。Gaudi 3は、主要な生成AIモデルのトレーニングと推論タスクで、同サイズのH100 GPUクラスタと比較した性能テストを実施し、優位な結果を得られたとアピール。一般的なLLMを実行した場合、対H100に平均で2倍高速だったと説明している。
同社の発表では、「Gaudiアーキテクチャは、大規模言語モデル(LLM)の学習と推論のため、NVIDIA H100に代わるMLPerfベンチマーク済みの唯一の選択肢。顧客が必要な生成AIの性能を、より低いコストで迅速に導入できるのがGaudiだ」と、名指しもしている。
なお、Gaudi 2の価格は、Gaudi 2アクセラレータ×8基のユニバーサル・ベースボードキットで65,000ドル。これは「競合の1/3のコスト」だそうだ。
あわせて今回、Gaudiのシステム・プロバイダーとして、既存のDell、Hewlett-Packard、Lenovo、Supermicroに加えて、新たにAsus、Foxconn、Gigabyte、Inventec、Quanta、Wistronの6社が加わったことも発表された。