Intelの日本法人インテルは6月26日、直近の自社の取り組みを紹介する「Intel Tech Talk」を開催。エッジでのAI活用の重要性と、その実現を加速する製品である「Xeon 6」ならびに「Lunar Lake」(開発コード名)についての説明を行った。
最初に登壇したインテル執行役員 技術本部長の町田奈穂氏は、2030年に1兆ドル規模となるという半導体市場予測に向けて、「AIを活用する社会の構築がけん引役になる」ことを強調。すべてのデバイスにAIを提供するAI Everywhereの実現に向けて、6月初旬に開催されたCOMPUTEX 2024にてエンタープライズおよびエッジ向けにXeon 6、AI PC向けにLunar Lake、そしてデータセンターAIのアクセラレータとして「Gaudi 3」を発表するなど、体制強化が進んでいるとした。
6700と6900以外にもシリーズ展開が計画されているXeon 6
2023年に登場した第5世代Xeonスケーラブルプロセッサ(Xeon SP。開発コード名:Emerald Rapids)の後継に位置づけられ、リブランドがなされた「Xeon 6」。Intelの最先端プロセスとなるIntel 3で製造される同製品は、Eコアのみを採用した効率性重視の「Sierra Forest」(開発コード名)と、Pコアのみを採用したパフォーマンス重視の「Granite Rapids」(開発コード名)がそれぞれ提供されることがアナウンスされている。
また、TDP別に最大350W(CPUあたり)の「Xeon 6プロセッサ6700シリーズ」、ならびに最大500W(同)の「Xeon 6プロセッサ6900シリーズ」として提供されることも予定されているが、ロードマップとしてはまずはEコア採用のXeon 6プロセッサ6700Eシリーズが登場した後、2024年第3四半期にPコア採用のXeon 6プロセッサ6900Pシリーズ、2025年第1四半期にはEコア採用のXeon 6プロセッサ6900EシリーズおよびPコア採用のXeon 6プロセッサ6700Pシリーズに加え、Pコア製品として、「Xeon 6プロセッサ6500Pシリーズ」および「Xeon 6プロセッサ6300Pシリーズ」も予定されているとする。この6500Pシリーズと6300Pシリーズについては今回、詳細な内容は明らかにされなかったが、6500Pシリーズは6700シリーズと同じソケットを採用する予定だという。
インテル技術本部 技術部長の渡邉恭助氏は、このEコアシリーズとPコアシリーズの違いについて、「BIOSや基板は互換性を持たせているが、Eコアはマイクロサービルやネットワーキング、メディアなどスループット指向のワークロードを対象としたシリーズ。一方のPコアはコアあたりのパフォーマンスを向上させており、AIやHPCなど演算負荷の高いワークロードを対象としたシリーズ」と説明。そうした用途の違いに応じて、採用しているマイクロアーキテクチャもEコア版では「Crestmont」(開発コード名)、Pコア版では「Redwood Cove」(開発コード名)と異なり、機能そのものが異なっている部分も多いとする。
また、第5世代Xeon SPでは2つの同一タイルを1チップに収める構成を採用していたが、Xeon 6ではEMIBでの接続方法に変更はないものの、コンピュートタイルとI/Oタイルの異なる機能の2つタイルでの構成に変更。「機能ごとに分けることで、これまでよりも柔軟にコア数の増加などをやりやすくなった」(同氏)とのことで、6700シリーズではPコア版が3種類のコア構成が用意されるとした。
その性能については、5年前の第2世代Xeon SPと比べて6700Eシリーズでウェブ&マイクロサービスで最大2.6倍、ネットワーキングで最大3.4倍、メディアで最大2.6倍、データサービスで最大2.7倍の性能向上を果たしたとする。そのため第2世代Xeon SPを搭載した200ラックに対し、6700Eシリーズでは66ラックで同等性能を提供できるとし、電力効率を高めることが可能になるとする。
パートナーの拡大で競争力の強化を目指すGaudi 3
IntelがデータセンターにおけるAI活用を推進するアクセラレータに位置づけられる「Gaudi 3」。5nmプロセスを採用して2つのダイを1パッケージに実装する形で製造され、OAM(Open Accelerator Module)、OAMを8基搭載したユニバーサルベースボード、そしてPCI Express(PCIe)のアドインカードの3形態で提供される。
また、24ポート備える200Gbps対応イーサネットを活用することで、最大1024ノード(1ノード8アクセラレータで合計8192アクセラレータ)でクラスタを構成することで、最大FP8演算で15ExaFlops、メモリ容量1PB、ネットワーク帯域幅1.229PBpsを提供することが可能だとし、そのコストパフォーマンスも「NVIDIA H100に対して、推論スループットで1ドルあたり2.3倍のパフォーマンスを提供するほか、学習スループットも同じく1.9倍のパフォーマンスを提供できる」(インテル技術本部シニア・アプリケーション・エンジニアの小林弘樹氏)としており、競争力のある価格設定を意識したとする。
さらに、Gaudi 3シリーズで注目なのは、アクセラレータとしてサーバに搭載するパートナーがGaudi 2までの4社から10社に増加している点。加えて、Gaudiシリーズを採用するユーザー企業も徐々に増加傾向にあるとしており、そうしたパートナーならびにユーザー企業を増やしていくことで、今後のAI市場において存在感を高めていきたいとしている。