Sandra 2015 SP3(グラフ51~66)

SiSoftware
http://www.sisoftware.co.uk/

このグレードの製品でGPGPU的な使い方がどの程度されるか? といわれると微妙なところであるが、一応測定したので結果をまとめてご紹介したい。ちなみにSandraはまたバージョンアップしており、今回はSP3となっている。

まずグラフ51~54がGP ProcessingをSingle/Half/Double/Quad-Floatで実施した結果である。こちらはまぁある意味順当というか、フルスペックのGM204からある程度コアを無効化したGTX970と、FijiのコアそのままのR9 Nanoでは勝負にならないのは明白であるが、取りあえず圧倒的な差が見られる。

これはCyptography(グラフ55と56)も同じである。AESに関してはEncryption/Decryptionの結果がほぼ同じなので、平均を取る形でまとめたが、こちらも圧倒的な差。比較的GeForce系コアの性能が高いHasing(グラフ56)でもその差は明確である。

この傾向はFinancial Analysis(グラフ57~59)やScientific Analysis(グラフ60~62)でも同じである。基本的にGTX970はOpenCLやDirectCompute経由のComputeShaderを使うと性能が出にくく(特にComputeShaderでの性能の落ち込みはひどい)、CUDAである程度性能が伸びるが、それでもR9 NanoのOpenCL経由には及ばないというあたりでしかない。

メモリ帯域についても、HBM×4のR9 Nanoは圧倒的に高速(グラフ63)である。もっともInterface周りは全般的にNVIDIAの方がマシで、グラフ64を見るとGTX970は比較的数字がそろっているのに対しR9 Nanoはバラつきが多い。これはR9 Nanoに限らずR9 Fury/Fury XやこれまでのGCNアーキテクチャ製品全般に言えることで、この持病はなかなか治らないということだろう。

それにしても、GPGPUとして使った場合の性能がこれだけ違うのに、3D描画での性能は差があるとはいえもっと差が小さい、というあたりがGPUの使われ方の差があることを物語っている様にも思う。

では、DirectX/OpenGLを使うとどうか? というのがグラフ65と66であるが、いくぶん性能差は縮まるもののやはり大きな違いがあることが分かる。取りあえず、そもそものコアの性能差はかなり大きい、ということが再確認できた。