Minimal RAM Latency(グラフ41~48)
Trinityでの結果はこちらだが、ここではあまり参考にならない。というのはTrinityとVisheraでは全くメモリコントローラが異なるからだ。Trinityの場合CPUとGPU両方のアクセスを賄う必要があり、なのでAMD FX系とは異なるものになっているという話はTrinityの発表の際にAMDから成されており、その意味ではこれに関しては今回がはじめてである。
ちなみにこのテスト、本来は8MB Blockと32MB Blockの2種類があるのだが、今回のケースではFX-8150/FX-8350共に8MBだと全部がL3 Hitになってしまってメモリアクセスの性能がさっぱりわからなかったので省き、32MBのみを示している。
ということでまずはL1 Hitのグラフ41~44。Forward(グラフ41)及びBackward(グラフ42)に関しては、一応差があるといえばあるのだが、大きな差とは言いがたく(1cycle未満)、またどちらが高速とも言いにくいのでこれはほぼ同等といったところ。ところがRandom(グラフ43)及びPseudo-Random(グラフ44)では大きな改善が見られる。勿論グラフの縦軸を見ていただくと判るとおり、絶対値としてのLatencyはかなり大きいから、平均7~8cycleの削減といっても比率で言えば2~3%程度でしかないのだが、それでも改善には間違いない。
これはL2 Cache Lineでのケースも同じで、Forward(グラフ45)やBackward(グラフ46)では殆ど差がないが、Random(グラフ47)やPseudo-Random(グラフ48)ではこちらも明確な差が見られる。とりあえずTrinityとの結果とは全く異なっており、VisheraのMemory ControllerはZambeziのものをベースに、特にRandom AccessにおけるLatencyの若干の改善を果たしたもの、と理解するのが正しいようだ。
次ページ:RMMA - I-TLB(その1)