◆RMMT 1.1(グラフ84~85)

久しぶりにRMMTも。今回はBlock Sizeを40MB/Threadで行っている。なので3D V-Cacheを搭載するRyzen 7 7800X3D/Ryzen 9 7950X3DはL3 Hitの確率が非常に上がるので、結果が凄い事になっているのを最初にお断りしておく。

  • グラフ84

  • グラフ85

これを念頭に置いてRead(グラフ84)を見ると、Core i9-14900KはほぼCore i9-13900Kと、Core i5-14600KはほぼCore i5-13600Kとグラフが重なっており、やはりこの部分には差が無いことになる。これはP-Core/E-Core共に同じであった。こちらにあるように、DDR5 XMPだとDDR5-8000を超えるメモリも使えるとしているが、あくまでこれはより高速なOC Memoryに対応というだけの話であって、メモリが同じならアクセス性能も当然同じであった。これはWrite(グラフ85)にも言える話で、やはりこの部分での性能差は無い事が再確認できた。

◆Sandra 20/21 R25 2021.12.31.133(ダイジェスト)(グラフ86~101)

Sandra 20/21 R25 2021.12.31.133
SiSoftware
https://www.sisoftware.co.uk/

Sandraだが、フルセットをやると猛烈にグラフ数が増えるし、なにより違いは動作周波数だけでアーキテクチャ類に差は無いし、キャッシュやメモリ廻りの改善なども入っていない。なので、純粋に動作周波数の違いがCPU性能にどう反映するか、だけを抜き出してご紹介したい。

  • グラフ86

  • グラフ87

  • グラフ88

  • グラフ89

グラフ86・87がDhrystoneで、グラフ86は全Thread(MT+MCとはMulti Thread+Multi Coreの意味)、87は1Threadである。なお(続くWhetstoneもそうだが).NETを利用する場合はP-Core/E-Coreの区別が無いので、グラフ中ではP-Core扱いで示している。なぜかNative IntegerでCore i9-13900KがCore i9-14900Kより高速、という不思議な結果が出ているものの、あとは概ね動作周波数通りという感じ。1 Threadの場合、NativeだとIntelのP-CoreとZen 4はほぼ同じ程度、E-Coreは6割程度の性能といったところで、動作周波数に応じて性能は微増しているが、まぁ大きな違いではない。この傾向はWhetstone(グラフ88・89)も同じであるが、MT+MC(グラフ88)でSingle NativeとDouble NativeでCore i9-13900KとCore i9-14900Kの性能差が結構バラつくのが気になるところではある。

  • グラフ90

  • グラフ91

  • グラフ92

  • グラフ93

ではEncryption/Decryption(グラフ90・91)は? というと、総合成績ではIntel優位だが1TだとAMD有利という以前からの傾向がそのままで、また動作周波数の違いによる性能差も感じられない。もっと言えばAMDはMT+MCと1Tで性能差が殆どないもの相変わらずで、要するに処理性能よりもメモリアクセスがボトルネックになっている(から、1Tの場合のIntelでは動作周波数の差で性能に違いがでる)という話である。ただHashing(グラフ92・93)では処理の方が再びボトルネックになりがち(Intelはちょっと怪しいというか、メモリアクセスと処理性能が微妙にバランスしているギリギリ、AMDは処理性能ネック)という感じだ。ただMT+MCだとAMDを圧倒できるIntel系が、1Tだと負けているあたりは、数の暴力という感じである。

  • グラフ94

  • グラフ95

  • グラフ96

Financial Analysis(グラフ94~96)はOption(Black-Scholes/Binominal/Monte Carlo)別にグラフを分類した。こちらは比較的動作周波数に応じてでCore i5-14600K/Core i9-14900KとCore i5-13600K/Core i9-13900Kの性能差が見られるが、大きな違いか? と言われると御覧の通り微増といった程度なのはまぁ致し方ない。

ところでP-CoreとE-Coreの性能比が、この3つでかなりバラつくのがちょっと興味深い。Monte CarloだとP-CoreはE-Coreの6割弱程度の性能なのが、Black-Scholesだと5割強、Binomialだと3割(33%弱)まで落ち込む。アプリケーションによっては、E-Coreはあまり助けにならない、という一つの実例ではある。

  • グラフ97

  • グラフ98

  • グラフ99

グラフ97~99がScientific Analysisであるが、GEMM(グラフ97)はAMDの3D V-Cacheが如何にこの手の計算に適しているかを露骨に示す結果になってしまった事に加え、Core i5-14600K/Core i9-14900KとCore i5-13600K/Core i9-13900Kの性能差があまりない(というか、どうかするとCore i5-14600K/Core i9-14900Kの方が低い)のは、コアの演算性能が内部のキャッシュを使い切ってしまってしまい、メモリアクセスがボトルネックになっている、と考えられる。だからこそ3D V-Cacheを搭載したRyzen 7 7800X3DがCore i9-13900K/14900Kと同等の性能で、Ryzen 9 7950X3Dが1.5倍の性能を叩き出しているという事だろう。これはFFT(グラフ98)も同じだが、こちらではAMDの3D V-Cacheであっても容量が足りないようで、完全にメモリアクセスがボトルネックになった結果であり、こうなるとやはりCore i5-14600K/Core i9-14900KとCore i5-13600K/Core i9-13900Kの性能差は殆どなくなってしまう。これはN-Body(グラフ99)も同じで、なので相対的にキャッシュ不足が緩和される1Tだと動作周波数による性能差が見られるが、MT+MCだと綺麗に並んでいる格好だ。

  • グラフ100

  • グラフ101

最後にCache&Memory Bandwidth(グラフ100・101)だが、なぜかRyzen 5 7600のみデータが取れない(Sandraが落ちる)ので、結果から除外している。それはともかくとしてMT+MC(グラフ100)だと、Core i5-14600K/Core i9-14900KとCore i5-13600K/Core i9-13900Kの間に一応差があるといえばあるが、もう誤差の範囲。1T(グラフ101)だとそれなりに性能差があるので、要するにもう少しキャッシュを増やさない限りあまり性能差が出ないというところに来ている感じだ。