考察

さて、ここまで長々とPhenomの分析を行ってきた。テストの結果をまとめると、

1. CPUコアにはかなり多くの手が入っており、性能面での改善は少なくない。
2. L3キャッシュの効果も大きく、これも性能面に寄与する部分は多い。また、Victim Cacheの方式そのものがボトルネックになっている形跡もなく、この方式は上手く機能していると言ってよい。
3. さりながら、L3キャッシュの2MBという容量の絶対値そのものが、最近のアプリケーションでは不足気味であるとも考えられる。より大容量のL3キャッシュの搭載が望まれる。
4. デスクトップアプリケーションでは、Unganged Modeの効果は殆どない。
5. CPUコアの絶対性能としては、ほぼCore 2と同等まで引きあがったと考えるが、Core 2を越えるところまでは来ていない。
6. 消費電力の高さは特筆すべきものがある。待機時の消費電力はAthlon 64の倍以上に跳ね上がっており、これを下げない限り動作周波数の向上を狙うのは難しい。

というあたりだろう。また、筆者の推定としては、

7. 設計期間の短縮を狙い、内部に高速・高消費電力のトランジスタを多用している様に思われる。まずはこれを設計しなおさない限り、単純にプロセスを微細化しても消費電力は減らないだろう。
8. 恐らくこれはAMDも理解しており、恐らくB4 Steppingに相当するバージョンの作業を行っていると思う(というか、思いたい)。さらにB3 Steppingの作業もあるから、しわ寄せがDual Coreのkumaに来て、こちらのリリーススケジュールが後ろにずれていると思われる。

というあたりだ。

さて、ここまでテストしてきて感じるのは、Phenomは余りデスクトップに向いていないという事だ。今回の全ての改良は、サーバー向け用途を念頭に置いたという観が非常に強い。L3を物理的に共有しながら論理的には非共有なんてのはその最たるもので、これを共有にすれば恐らくデスクトップ向けアプリケーションでは若干性能が上がったと思うのだが、敢えてそれをしていない。消費電力も、デスクトップにはちょっと過大であるが、ちゃんとした冷却機構を備えたサーバー向けならば許容される。FPUの強化とかSSE128の搭載は、デスクトップ向けにはまだご利益が少ないが、科学技術計算向けには有力な武器となる。丁度初代のAthlon 64みたいなもので、サーバー向けを無理やりデスクトップに載せました、という雰囲気がありありと感じられる。このあたりは、Mobileから派生したCore 2系とは明確に異なる部分だ。

そう考えると、よくここまでIPCを引き上げたと感心せざるを得ない。Coreの場合、ピークでは5命令/Cycleを実現できる非対称型デコーダ&実行ユニットの組み合わせ(この話は以前Second Opinionで説明した)を投入することで、最適化を行ったプログラムが効率よく動作する事を目指し、平均値でIPC=3を実現している。対するPhenomは、3命令/Cycleの対称型デコーダ&実行ユニットを如何にフルに動かすかに専念する形で、ほぼ同程度のIPCを実現してしまった。普通に考えれば、ピークで5命令/Cycleを実現できる構造と、ピークでも3命令/Cycleしか出せない構造のどちらが3命令/Cycleを実現しやすいかは自明であり、敢えて茨の道を選んだAMDを賞賛したいと思う。

ただこの先は? というと今のままでは難しいだろう。とりあえず消費電力に関しては、これは設計をやり直せば済むレベルの話だが、IPCの伸び代は現在のアーキテクチャでは殆ど残ってないように思われる。本来PhenomはCore 2ではなくNehalem世代と戦うべきアーキテクチャであり、今のままではこれに勝つのは難しそうだ。

ただ既に32Bytes/cycleのプリフェッチが実現できている事を考えると、デコーダや実行ユニットをもう一組分増やすのはそう難しくない気がする。今回のプリフェッチの高速化は専らSSE128向けを意識したものだが、通常のx86命令には間違いなくOver Qualityなスペックになっている。デコーダを4命令/Cycleにしても、8Bytesの命令が4命令同時に取り込める訳で、こうした方向性は技術的には可能だと思う。

問題は、本当にそちらにゆくか? である。SSE4Aに続きSSE5やこれに続く世代でFusionを意識した命令拡張が施されてゆくという方向性が大枠で示されている以上、x86命令そのもののIPC向上はこれで打ち止めにされても不思議ではない。こうした改良が施されるとすれば、(2010年まで後退した)Bulldozerコアがそれを担う事になるが、果たしてx86で4命令/Cycleを目指すのか、3命令/Cycle+アクセラレータになるのか、もう少し時間が経たないとはっきりはしないだろう。

ちなみにそんなわけで短期的にはPhenomは依然として消費電力が多い&動作周波数が上がらないという二重苦を抱えるままとなるだろう。筆者としてはむしろデスクトップ向けにGriffinプロセッサ(最近Turion Ultraという名前が決まったらしい)に期待したいところだ。Phenomに比べるとサーバー向けのEhnancementはないし、L3キャッシュも無いが、CoreのImprovementはそれなりに行われているし、なにより省電力である。一応今年前半にはリリースされるということで、ある程度自作マーケットにもこれが流れることをぜひ期待したい。