新たなフラッグシップとなるLunar Lake
2024年第3四半期に登場がアナウンスされているAI PC向けSoC「Lunar Lake」(開発コード名)。同製品についてインテル技術本部 部長の安生健一朗氏は「Meteor Lakeの後継ではなく、AI PC向けフラッグシップSoCという位置づけ」と説明。Lunar Lakeのポイントとして、x86アーキテクチャでありながら、徹底的に低消費電力を実現することにこだわることで、Meteor Lake比で消費電力を最大40%削減しつつも、シングルスレッドの性能やグラフィックスの性能を向上。NPUも性能向上を果たしているが、「Intelの戦略としては、当初よりCPU、GPU、NPUを適材適所にアプリケーションごとに活用できる演算能力を提供することを目指してきた」(同氏)と、CPU、GPU、NPUまんべんなく性能向上を果たしつつも、消費電力の削減に向けたさまざまな工夫を施してきたことを強調する。
Lunar Lakeのチップ構成は、パッケージ基板の上に最大2チップのLPDDR5X DRAMとベースタイル上にFoverosを活用してコンピューティング・タイル、プラットフォーム・コントロール・タイル、そしてダミーとなるフィラータイルが搭載された形となる。ベースタイルはIntelの22nmプロセスで製造されるほか、コンピューティング・タイルがTSMCのN3B、プラットフォーム・コントロール・タイルがTSMCのN6プロセスを採用する。
特徴的なのがDRAMを同一チップ上に搭載する試み。「メモリ・オン・パッケージはかなり大胆な試み」(同氏)と、Intelとしても初の試みであることを強調する。これによりノートPCのマザーボード上にメモリを搭載するスペースが不要になり、基板サイズを最大250mm2削減できるようになると同社では説明するほか、メモリが消費する電力を抑えることができるようになり、PHYの消費電力を最大40%削減(Meteor Lake比)できるようになるとする。
このほか、Pコアの「Lion Cove」(開発コード名)は、性能・消費電力・面積(PPA)のバランスを最重要視する形でマイクロアーキテクチャをほぼ刷新する形で開発されており、低消費電力を実現する手法として、ハイパースレッディングテクノロジー(HTT)の非搭載化、L0キャッシュの追加とL1キャッシュおよびL2キャッシュの容量増加によるキャッシュミスヒット時のレイテンシ改善によるIPCの向上、電源周波数のAI制御によるオーバーシュートの削減、クロック間隔を従来の100MHz単位から16.67MHz単位へと細分化などを採用。こうした取り組みにより、Meteor LakeのPコア(Redwood Cove:開発コード名)と比べて、同じ周波数で動作させると平均14%のIPC向上を果たしたほか、1Wあたりのパフォーマンスも10%以上の向上を果たしたとする。
重要な位置づけを担うLunar LakeのEコア
Lunar LakeにはPコアのLion Coveに加え、新たなEコア「Skymont」(開発コード名)も搭載されている。
Meteor Lakeでは、PコアとEコアに加え、SoCタイルにLow Power Eコア(LP Eコア)と呼ぶ、アイドル時や負荷が高くないときに使われる別のEコアが搭載されていた。これをLunar Lakeでは、1つのEコアとするべく新たなアーキテクチャとしてSkymontが開発された。
安生氏は「低電力アイランドにありながらも、性能のダイナミックレンジを持った、マルチスレッドのパフォーマンスを向上させるアーキテクチャに変更するのと同時に、ベクトル演算とスループットの向上のためにVNNI(Vector Neural Network Instruction)機能のサポート強化も実施。拡張性にも考慮を行うなど、全体的なパフォーマンス向上を意識して開発された」と、その重要性を強調。分岐予測の考慮のための並列フェッチ数の増加やより深い命令を探ることでプログラム内の並列度の抽出を高める工夫や、AIスループット向上のためのSIMDベクトル演算のレイテンシ改善の工夫などを行った結果、Meteor LakeのEコア(Crestmont:開発コード名)と比べて、シングルスレッドFP性能は1.68倍に向上したほか、マルチスレッドINTでは、Crestmont×2に対してSkymont×4構成で、LP Eコアの最大性能時に比べて消費電力は1/3に低減、パフォーマンスは2.9倍向上できるようにしたとする。
Eコアで低消費電力ながら高性能を実現したことでHTTの搭載を辞めることが可能になり、より低消費電力で高い性能を発揮できるようになるめどが立ったという。
さらなる電力削減に向けThread Directorも進化
Lunar LakeではPコア、Eコアの刷新による提唱電力化と高性能化に加え、第12世代Intel Coreプロセッサ以降搭載されるようになったPコアとEコアの最適タスク振り分け機能である「Intel Thread Director」も、よりかしこくタスク配分を実行するべく改良が加えられた。
これまではWindows 11のスケジューラとThread Directorが勝手にアロケーションを決めていた部分があり、必ずしも常にユーザーの意図した通りの動きになっていたわけではなかったという。そこに今回は手を加えて、OEM(PCメーカー側)が意図するニーズ(パフォーマンス重視やバッテリーの長寿命重視など)を踏まえて、タスクスケジュールの制御をしやすくすることで、低消費電力化を実現することを図ったという。
具体的には、アルゴリズムの改良によって細かな粒度に基づく示唆を得る形でユーザーに連続性のある体験を提供できるようにしたとするほか、OS側が制御する部分として、「OSコンテインメント・ゾーン」を用意。これを活用することで、例えばあるアプリケーション上の処理スレッドは負荷が高まってもEコアからPコアに移行せずに、Eコアのまま処理を続けるといった「電力効率」であったり、最初はEコアで処理をするが、処理の途中でパフォーマンスが不足していると判断された段階でPコアに渡す「ハイブリッド/コンピューティング」、そしてフルパフォーマンスで処理を行う「ゾーンレス」といった区分けに応じたスレッド処理をOS側で選択可能とした。
PMICによる電源供給アーキテクチャの採用でさらなる電力効率の向上を実現
Lunar Lakeでは、GPU、NPUも刷新されている。GPUは第2世代Xeという位置づけとなる「Xe2アーキテクチャ」(開発コード名:Battlemage)が採用される。XVE(Xe Vector Engine)の実行レーンを8レーンから16レーンに拡張しつつ、全体のXVEの数としてはMeteor Lakeから半減(16基→8基)とした(レーン数の増加と演算器の減少で相殺され演算器の総数そのものは変わらない)一方、XMX(行列演算エンジン)が追加された。また、eDP1.5への対応や新たな電力制御技術の採用なども行われ、Meteor LakeのGPU(Xe-LPG)と比べ、1.5倍のグラフィックス性能を提供。AI処理性能としては67TOPSを提供するとしている。
AI処理としてはNPUも第4世代(NPU 4.0)に進化。演算器(Neural Compute Engine)は前世代比3倍の6ユニットへ、浮動小数点演算ユニット(SHAVE DSP)も12基へと増加したほか、LLMに使用されるトークナイザ処理への対応なども行われている。加えて、それらの処理に対応するためにDMAの帯域が2倍に拡張されたという。
このほか、Lunar Lakeのチップとして新たにメモリコントローラ内に8MBのメモリサイドキャッシュも搭載している。これにより、従来はCPUとI/OやNPUなどの処理のやり取りに必要だったDRAMを経由する作業がキャッシュを経由するだけで済むこととなり、メモリに関連する電力の削減が可能になる。このほか、PMICに基づく電源供給アーキテクチャも採用。このPMICに関してはパートナーから供給されたものだとするが、この取り組みも電力効率の向上につながっているとするなど、全体として電力をいかに抑えつつ、高い性能を発揮できるか、という課題に取り組んだSoCであることが強調されていた。
なお、Intelは2024年第4四半期に、さらに次世代となるArrow Lakeを発表する予定だが、こちらは「オントラック」(安生氏)とするものの、詳細については現段階では発表できるものはないとしていた。