◆消費電力測定(グラフ143~146)
絶対的な消費電力そのものは以前お届けしているが、Intelの14nm++とIntel 7を比較して、どの程度プロセス技術が改善されたのか、をちょっと確認してみたいと思う。
具体的にはBIOS Setup及びIntel Extreme Tuning Utilityを併用して、動作周波数を変化させながら、その際の消費電力を測定するというものだ。CPUの負荷はAIDA64のSystem Stability Testを利用し、CPU/FPU/cache/system Memoryに負荷をかけ続け、その際の平均消費電力を測定するという方法で行っている。
まず14nm++の代表例として、Core i9-11900Kの結果がグラフ143である。Intel Extreme Tuning Utilityでは最小が35倍だったため、35倍(3.5GHz)~47倍(4.7GHz)まで実施した。47倍まで、というのはその47倍(Photo05)でThermal Throttlingが発生した(Photo06)。
同様にCore i9-12900Kの結果がこちら(グラフ144)。こちらは49倍(Photo07)で限界に達した(Photo08)。なおIntel Extreme Tuning Utilityで設定できる下限は32倍だったので、8倍~31倍の動作設定はBIOS Setupで行っている。またE-Coreを連動させると倍率が39倍以上にならないので、今回はBIOS SetupでE-Coreを無効化し、P-Coreのみで比較した。
このグラフ143と144の、開始後30秒~150秒の間の平均消費電力を、動作周波数との関係でプロットしたのがグラフ145である。破線は近似曲線であり、赤丸が付いている部分がThermal Throttlingが発生した箇所である。今回の場合、2つのマザーボードは異なるし、メモリも異なるから、0倍の時の消費電力が50Wほど異なるのは、プロセスの違いというよりはマザーボードとかメモリの違いに関係するものと考えた方が良い(Core i9-11900Kは比較的シンプルなASUS TUF GAMING Z590-PLUS WIFI、一方Core i9-12900Kはフル装備のASUS ROG MAXIMUS Z690 HEROである)。
そこで2つのグラフの初期値を一緒にするようにずらしたのがグラフ146となる。こうしてみると、確かに消費電力そのものは14nm++→Intel 7で大幅に減っていることが判る。実際47倍における消費電力差はIntel 14nm++が289W、Intel 7では163.5Wとなり、125.5Wもの消費電力削減につながっている。しかしながら、特に45倍あたりからIntel 7の消費電力の増え方が急激になっているのも事実で、近似曲線を見る限り50~51倍あたりで両方のグラフがクロスしそうである。その意味では、「Intel 7になって消費電力削減が可能になった」のも「同じ消費電力ならより高速に動作する」のも事実だが、動作周波数の限界そのものはIntel 7の方がむしろ低いというか、先に破綻しそうだ。
全コア常時5GHz駆動を行ったCore i9-9900KSみたいな製品をIntel 7で作るのはかなり困難な様に思える。以前のレビューの際に「できれば100W位に消費電力を絞って使う方が幸せになれそうな気がする。」と書いたが、実際45倍あたりまでで止めておくのが幸せそうで、それ以上は急速に消費電力が増える事になると考えた方が良いだろう。
考察
ということで大分遅くなったがAlder Lake Deep Diveを、Zen 3やRocket Lakeも併せてお届けした。もう既に入手されているユーザーも多いと思うし、レビューも色々出ているわけで、今更という感じかもしれないが。
Alder Lakeに対しての筆者の感想は、RMMAのところの結論でも述べたように「まだ熟成の余地がある」に尽きる。もっと言えば、Cypress Cove(≒Sunny Cove)の中身が、思ったよりはSkylakeに近かった事で、基本CoveシリーズはSkylakeの延長にある事が確認された格好だ。Alder Lakeは高い性能を叩き出しているが、それはDecoderとALUを増量するという力業が成せる技であって、それで増えそうな消費電力をプロセスの微細化で抑え込んだという、やや荒っぽいコアである。これがもう少し洗練されるのは、Raptor LakeかMeteor Lakeの世代になりそうだ(そのMeteor Lakeはちょっととんでもない話を聞いたが、裏が取れていないので今回は割愛する)。まぁ荒っぽくても性能は出る訳で、ややピーキーな部分が無くもないが、Intel 7がちゃんと想定通りの性能が出たことで救われた感がある。
一方Zen 3はそろそろこれをいじるのも限界、という感じが改めて確認できた。3D V-Cacheの搭載でメモリアクセスを多用するアプリケーションでは性能が向上しそうだが、その効果は限定的にならざるを得ない。ただここまで成熟している以上、次は5命令/cycleのDecoderの搭載はほぼ決定的だと筆者は考えている。5nmプロセスに移行すれば利用できるトランジスタ数も配線も増えるから、AVX512をサポートしても、それに対応帯域をL1 D-CacheやL2 Cacheに与えるのはそれほど難しくないだろうし、AVX512ユニットの実装もそれほどエリアペナルティ無しに実現できるだろう。はっきりしないのが、IntelのGNAにあたるNeural Processorの搭載の有無である。現状IntelのGNAがごく限られたアプリケーションしか対応していないことを考えると、多分Zen 4の世代には入らない(か、そうしたものはZen 4の世代には統合されるとみられるNavi 2ベースのGPUにオフロードする)のではないかと思う。