なんでこんな構造になったのか、という事は容易に想像が付く。Phenom世代では、SSEの処理性能がAthlon 64 X2に比べてほぼ倍増されている(Photo03)。SSE命令のフォーマットも一般にはA×B→A(データAとデータBを取り込み、この間で行った実行結果をAに書き戻す)という形になる。ここでAの書き戻しのスピードを2倍にするためには、もともとのAとBの取り込み速度をどちらも2倍、つまり合計で4倍にしなければならない。Readが4倍速、Writeが2倍というのはこのセオリーにぴったり沿った性能改善であると思われる。
これにあわせて、ということかどうかは判らないが、L2もかなり高速化されている。グラフ10、つまりReadの結果を簡単にまとめたのが表2だが、L2はCore 2 Quadと同等、L3もメモリよりは高速であり、これだけみれば十分にスピードが稼げそうな雰囲気である。WriteやCopyについてはグラフ11/12から読み取っていただきたいが、概ねCore 2 Quadと同等レベルまで性能を引き上げてきた事が判るだろう。
表2 |
ただ、帯域だけあげてもレイテンシが大きかったら意味がない。こちらについても同時に見てみた(グラフ13~16)。
結果から言えば、「Athlon 64 X2とCore 2 Quadの中間」といったあたりに落ち着いていることが判る。L1/L2のレイテンシは概ねCore 2 Quadと同等(微妙にL2は遅い程度)、L3は概ねAthlon 64 X2のL2並といったところ。ただトータルのキャッシュ容量の少なさは否めず、早いタイミングでメモリアクセスが発生するため、どうしてもレイテンシは大きめといった結果になっている。それでも、Athlon 64 X2と比較すると、大幅に高速化している事は間違いない。