次はメモリアクセスである。まずグラフ9はSSE2を使ったInt/Float時のBuffered Memory Accessである。
ここではあまり動作周波数は関係ない(メモリの速度で律される)事もあってか、
Core 2 < Phenom系 < Core i7
という図式が明確に示されている。Core 2とPhenom系は今回どちらもDDR2-800を使っているから、理論上の帯域は12.8MB/secということになるが、Core 2はその半分程度、Phenom系は75%ほどの効率になる。Core i7はDDR3-1066×3で理論上25.6GB/secとなり、7割弱といったところ。今回のレポートでは触れないが、別にRMMTを実施した場合、Phenom系の効率は(理論値と比べると)かなり高い数値を見せており、むしろDDR2を使っていることがやや足を引っ張っている雰囲気もなくは無い。
もう少し詳細を観たのがグラフ10である。
L1/L2の範囲における帯域は比較にならない(とはいえ、Phenom II X4 940もL1の範囲では200GB/secに到達しているから、そう悪い数字でもない)にしても、その先の落ち方を見るとCore 2やCore i7にそう引けを取るものではないことが判る。
ではLatencyはどうか? ということで、グラフ11は1KB~64MBにおけるLatencyの平均値である。
大雑把にみればこんなものか、という感じだが、Random AccessにおいてPhenomとPhenom IIのLatencyの差はかなり大きく、このあたりに容量増加以外の何か工夫が凝らされた事が推察される。
実際、Random Accessの詳細(グラフ12)を見ると、256KBあたりまでと16MB以降は殆ど差がないのに、L2/L3のカバー範囲にあたる1MB/4MBのスコアが大幅に改善されており、このこの差がグラフ11における結果に繋がったと思われる。これはLinear Accessにおいても同様(グラフ13)で、このあたりがAMDの言う「IPC Improve」に関係しているのではないかと想像される。