全ダイに3D V-Cacheが搭載されたGenoa-X

続いてはGenoa-Xであるが、こちらは既にMilan-Xという前例があるから、理解がしやすい。Ryzen 9 7950X3Dなどと異なり、こちらは全ダイに3D V-Cacheが搭載されているので、総L3容量は1.1GBに達する(Photo14)。といってもそれ以外は特に目新しい話はないのだが……。

  • 正確には96×12=1152MB

    Photo14:正確には96×12=1152MB。Milan-Xの時はL3だけだと768MBとちょっと中途半端な数字だったためか、L1/L2まで全部合計して「ソケットあたり804MB」とか無理やり数字を上乗せしていたが、Genoa-Xでは1GBを超えたためかそうした涙ぐましい工夫は無し

SKUはPhoto15に示す3モデルのみ。

  • 逆に言えば9684Xのみ、なんでここまで動作周波数を引き上げたのかがちょっと謎である

    Photo15:逆に言えば9684Xのみ、なんでここまで動作周波数を引き上げたのかがちょっと謎である。といってもFbaseだけでFboostは同じなのだが

ちょっと3D V-Cache無しと比較してみた結果が表1であるが、ハイエンドの9684Xを例外(これのみDefault TDPが400Wになっている)、基本3D V-Cacheを搭載するとやや動作周波数が下がっているのがお判りかと思う。

  • Genoa-Xと同クラスの3D V-Cache無し第4世代EPYCとの比較

    表1:Genoa-Xと同クラスの3D V-Cache無し第4世代EPYCとの比較

これはRyzenも同じで、3D V-Cacheは熱に弱い(分子間力で接続されているので、高温になると材料の熱による歪みで接続がはがれてしまう)のを防ぐために、やや低めの温度で動作する様に動作周波数を下げられている。もっともこれはRyzen 9 7950X3Dとかでも同じなのだが、でも実際には動作周波数を下げてもゲームなどではむしろフレームレートが上がったりするわけなので、この辺はアプリケーションとの相性ということになる。

ちなみにAMDによる用途別のお勧めがこちら(Photo16)。

  • alt属性はこちら

    Photo16:EDAツールの場合、Single Threadで動作するものがまだ結構あるため、コア数を下げてその分動作周波数を上げたEPYC 9184Xが最適という訳だ

殆どのアプリケーションには32CoreのEPYC 9384Xが最適としている。こちらはトータルのL3容量は768MBでしか無いが、その代わりトータル32コアだからコアあたり24MBと、EPYC 9684Xの2倍の容量が利用できる。本当にキャッシュ容量が必要なアプリケーションでは、むしろ使い勝手が良さそうだ。

性能としては、例えばEDAツールの場合、Genoaと比較して最大73%高速(Photo17)、科学技術計算ではSapphire RapidsベースのXeon Platinum 8462Y+と比較して平均でも1.5倍、最大では2倍近く高速としており、最大構成同士だと更に差が開くとする(Photo19)。

  • SynopsysのVCSを利用して、RTLの検証を行った場合の速度比較

    Photo17:これはSynopsysのVCSを利用して、RTLの検証を行った場合の速度比較

  • 32コア製品同士での比較

    Photo18:これは32コア製品同士での比較。結果はバラつきがあるので、平均及び最大値が示されている

  • 今度は60コア vs 96コアでの比較

    Photo19:今度は60コア vs 96コアでの比較。一応両社のハイエンド製品同士、という形だ

ところでMilan-Xの時も、Microsoftはこれを採用したHBv3での性能を開示しているが、同様にGenoa-Xを搭載したHBv4インスタンスの性能を開示している。今回は細かい分析は割愛するが、アプリケーションや動作条件によって効果は変動するものの、きちんと容量をあわせて使う事で大幅に性能が上がる事が示されている。ちなみにこのHBv4インスタンス、当初のプレビュー版はGenoaベースだが、一般提供はGenoa-Xに更新の上で行われる事になっている。

ということでまずはEPYCについて簡単に情報をまとめてご紹介した。次回はInstinct系の話題を取り上げたいと思っている。