ベンチマークPart 2:内蔵グラフィックス
さて、次は内蔵GPUを利用したケースでの比較を行ってみたい。Core i7-3960Xは利用できないので、ここからはCore i7-2700KとCore i7-3770Kの2製品での比較となる。ちなみにRMMAに関しては、一応テストは行って結果を確認したものの、殆ど差がなかったので、こちらでは割愛する。
Sandra 2012 Engineer Edition(グラフ110~124)
まずはSandra。グラフ110と111がそれぞれDhrystoneとWhetstoneでの比較となるが、むしろCore i7-3770Kの方がやや上回る性能を出しているのが判る。もっと正確に言えば、Core i7-2770Kは内部GPUでそれほど性能差が無いのに対し、Core i7-3770Kでは内蔵GPUを使うとむしろ性能が伸びている。グラフ1・2からDhrystone iSSE4.2とWhetstone iSSE3の値を抜き出してみると、
Dhrystone(GIPS) | Whetstone(GFLOPS) | |||
---|---|---|---|---|
外部GPU | 内部GPU | 外部GPU | 内部GPU | |
Core i7-2700K | 152.64 | 153.40 | 93.69 | 93.84 |
Core i7-3770K | 147.08 | 155.09 | 92.88 | 97.52 |
という、ちょっと不思議な結果になっている。もっともこの傾向はDhrystone/Whetstoneに留まらない。Processor Multi-Media(グラフ112)でもCore i7-3770KのスコアはCore i7-2700Kと同等以上である。Cryptgraphy(グラフ113)ではまだ若干のビハインドはあるが、その差はずっと小さくなっている。
Multi-core Efficiency(グラフ114)の結果はほぼ同等。Detail(グラフ115)を見ると、僅かながらCore i7-3770Kが上回る部分が多い結果になっている。Memory Bandwidth(グラフ116)を見ると、Streamの結果はまだCore i7-2700Kが上回っているが、Cache&Memory Bandwidth(グラフ117)ではむしろCore i7-3770Kが全般的に少し帯域が増えているのが判る。Latency(グラフ118~120)についても、L1では完全に同等、L2~LLCではややCore i7-3770Kが有利と言ったところ。先の考え方からすると、内蔵グラフィックを利用しているケースでは、実質的なTurbo Boostの状態がCore i7-2700KとCore i7-3770Kでほぼ同等であり、そうなるとコアのIPC改善などの効果でCore i7-3770Kの性能が高くなる、という考え方で良いのではないかと判断できる。
グラフ121と122はVideo Renderingのテスト結果である。実はSandraの場合、他にGPGPUのテストもあるのだが、Core i7-2700KはもとよりCore i7-3770Kもエラーでテストが通らなかった。一応OpenCLには準拠だった筈だが、今回利用したドライバはまだ対応が十分ではなかったようだ。そんなわけでGPGPUは省いてDirectX/OpenGLベースでの比較である。
さて、グラフ121がNative Floatでの、グラフ122がEmulated Doubleでの結果であるが、見ての通りどちらも綺麗にダブルスコアである。GPUに関しては、概ね性能が倍増、という表現はこの結果を見る限り適切と言えよう。
グラフ123はGPUからInternal Memoryにアクセスした際のBandwidthだが、この場合はRing Bus経由でメインメモリを直接アクセスする性能となる。意外にもこちらは大差が無い結果となった。ところが、System to Device/Device to Systemの転送速度(グラフ124)は、これまたダブルスコアになった。もっともこちらの場合でも、やっていることはメモリからGPUコアにデータを送り、そこからメモリに送り返す(System to Device)か、その逆パターン(Device to Memory)なので、概ねグラフ123の半分の性能が期待出来る訳だが、Core i7-3770KはともかくCore i7-2700Kはかなり低い数字でしかない。このあたりも、GMA3000→GMA4000で改良されたポイント、ということになるのだろう。