「Haswell」完全攻略!! (追加検証) - 内部解析で第4世代Coreの真実にさらに迫る

D-Cache/RAM Bandwidth(グラフ73～75)

では次にD-Cache周りについて確認してみたい。まずはBandwidth。グラフ73がReadであるが、ピークで見ると、

	Ivy Bridge	Haswell
L1	32 Bytes/cycle	32 Bytes/cycle
L2	18 Bytes/cycle	20 Bytes/cycle
L3	10.7 Bytes/cycle	12.7 Bytes/cycle

ということで、HaswellではIvy Bridgeに比べて若干ながらL2/L3のBandwidthが引き上げられているのがわかる。

ではWrite(グラフ74)は? というと、

	Ivy Bridge	Haswell
L1	16 Bytes/cycle	16 Bytes/cycle
L2	10.2 Bytes/cycle	10.5 Bytes/cycle
L3	7.2 Bytes/cycle	7.8 Bytes/cycle

といったあたり。ただ特徴的なのは絶対的な値よりも、特にWriteでL1～L3の各Bandwidthが綺麗にフラットなことで、このあたりL2で多少暴れているIvy Bridgeと好対照を成している。結果としてCopy(グラフ75)も、L1の範囲では変わらないがL2/L3では若干の性能改善が実現している。このあたりは純粋に帯域を増やしたということだと思う。

ちなみにこの数字はグラフ14～17と完全にはマッチしない(グラフ14～17はL2/L3がもう少し低め)が、これはDecode側がボトルネックになっているためと思われる。

次ページ：RMMA 3.8 - Maximum RAM Bandwidth