Sandra 2013 Engineer Edition(グラフ117~129)
SiSoftware
http://www.sisoftware.co.uk/
ここまでゲームベンチの結果を見てきたが、ではGPGPU的にはどうか? ということで、Sandra 2013の結果を。グラフ117と118はGPGPU Processingの結果だが、OpenCLではRadeon HD 7970 CrossFireに追いつかない(それも差が結構大きい)結果になった。ただCompute Shaderでは差が詰まっており、Doubleではむしろ逆転するという面白い結果になっている。
理由の考察は後回しにして、グラフ119と120がVideo Processingだが、こちらでもほぼ同じ傾向。Radeon HD 7990のスコアは、Radeon HD 7970(Single)より若干良い程度である。
ところが、全部が全部そういうわけではなく、例えばAES Encryption(グラフ121)やDecryption(グラフ122)、SHA-256 Hasing(グラフ123)ではRadeon HD 7990が最速である。
何でこんな事になるのか? だが、次のGP Bandwidthでその結果が推定できる。Internal(グラフ124)ではRadeon HD 7990はかなり高速(Compute ShaderでGeForce系列が爆速なのは、アーキテクチャの違いによるものなので、ここではおいておく)である。
ところがSystem to Device(グラフ125)やDevice to System(グラフ126)では、Radeon HD 7990の性能はRadeon HD 7970 CrossFireの半分でしかない。
要するに今回のテスト構成だと、PCI Express x16レーンが2本あるから、Radeon HD 7970 CrossFireは2枚のカードがどちらもフルにPCI Expressの帯域を利用する事ができる。なので、PC側のMemoryとI/Oを煩雑に行うような処理の場合、Radeon HD 7970(Single)の倍近い性能が出る。
ところがRadeon HD 7990ではPCIe Switch経由で1本のPCI Express x16レーンに接続されているから、メモリI/Oが多いケースでは実質使える帯域はRadeon HD 7970(Single)とほぼ同等になる。AMDの場合はドライバレベルでのOpenCLへの最適化がかなり進んでいるから、こうしたハードウェアの差が性能にそのまま響きやすい。
ただ、ではRadeon HD 7990の構成にはメリットはないのか? というとそんな事はなく、処理が重く、2つのGPUの間で煩雑にデータ交換が行われ、入出力のデータ量はそれほどでもないケースではメリットが出てくる。
今回で言えばグラフ121~123がそれだ。こうしたケースでは、CPU経由でデータ交換をするよりも、PCIe Switchでデータ交換が行える分Radeon HD 7990の方が処理効率が上がるので、結果として性能も高くなっていると想像される。
これを裏付けるのは、SLI/CrossFireの効果がほとんどない、Video Bandwidthのテスト(グラフ127~129)で、Radeon HD 7990のスコアがRadeon HD 7970(Single)とほとんど差がないことからもこれが分かる。