そんな訳で前書きが長くなったがMemoryである。既にCacheのところである程度スコアが示されているから、Nehalem MAのMemrory Access性能が優秀な事は大雑把にはお分かりかと思うが、グラフの都合で横軸を対数表示としたので、ちょっと見にくい。どっちみち、Memory Accessの領域では大きく数字が変動しないので、16MB~32MBの範囲の結果を平均したものをまとめて示すことにした。
まずグラフ66がRead/Write/CopyのBandwidthである。今回の場合、メモリアクセスの理論値は、
●Core i7 : DDR3-1067×3=25.6GB/sec
●Core 2 : DDR3-1333×2=21.3GB/sec
ということになるが、Core 2の方は1600MHzのFSBの制約を受けるから、実質、
●Core 2 : 1600MHz×8Bytes/sec=12.8GB/sec
ということになる。要するに理論上の帯域はほぼ半減するわけだ。
で、結果を見るとReadはともかくWriteやCopyは半分を更に下回る結果になっている。絶対的な数値で言えばどの結果も理論値にかなり遠いが、RMMAはSingle Threadだから使い切るのは難しい、ということだろう。
Bandwidthの次にLatencyも見てみよう。同様に16MB~32MBの範囲で、I-Cache Near Jump/Far Jump/D-Cacheのテスト結果をまとめたのがグラフ67~69である。
Random Accessに関してはCore MAの方がややLatencyが低いのは興味ある部分だが、Sequential AccessではCore MAが20cycle台なのに対しCore MAは30cycle台であり、10cycleもの差があるのはかなり大きな違いと言える。この部分はもはやCPUのCoreにはあまり関係なく、純粋にMemory ControllerのLatencyということになるわけで、FSB(と、CPU/MCHに置かれたFSB用のBIU)の行き戻りで10cycleを要していた分が削減できた、と判断して良いのではないかと思う。