米国時間の3月16日、AMDはOEMに対してRyzen Mobile 4000シリーズの出荷を開始した。これはあくまでもOEMに向けて、という話であってOEMメーカーから製品が投入されるのはもう少し先の話であるし、なにせ今回出荷開始されたのはBGAパッケージのみだから、店頭に並ぶ事はまず無い。筆者を含めてSocket AM4のPGAパッケージ版を待つユーザーは少なくないと思うが、もう少々我慢して待つしかない。
さてそのRyzen Mobile 4000シリーズ(以下面倒なのでコード名のRenoirとする)であるが、詳細に関して2月に説明が行われたので、この内容をお届けしたい。
Architecture
Renoirそのものは今年のCESで発表されたが、ラフに言えばZen 2(8コア)+Vega(8コア)という構成を、7nmプロセスでモノリシックダイで提供するというものである。まずCPUの方であるが、マイクロアーキテクチャそのものはZen 2そのままで特に変更はない(Photo01)。ただCCXに関して言えば、Ryzen 3000シリーズがCCXあたり16MB、1ダイ(=2CCX)あたり32MBだったのに対し、RenoirではCCXあたり4MB、ダイ全体で8MBになっている。
一方のGPUである。基本は7nm Vegaの構成そのままだが、Raven Ridge/Picassoが11CU構成なのに対し、Renoirは8CU構成である。ところが実際にはPhoto03にあるように、Data Fabricの広帯域化や動作周波数の向上、更にLPDDR4X-4266サポートによるメモリ帯域の増加(Raven Ridge/Picassoは公式にはDDR4-2400のサポート)などもあり、理論性能そのものは若干下がっているものの、実効性能はむしろ向上した、としている。このあたりは後程ベンチマーク結果を交えてご紹介したい。
ちなみにそのVega GPUにおける省電力の効果がこちら(Photo04)。1CUあたりの性能が最大59%向上したとしている。その内訳は、主に7nmプロセスを利用することで性能/消費電力比を改善したことだそうだ。
そのVega GPUに付属するMedia Encoderであるが、ラフに行って3割ほどの性能改善が図られたそうだ(Photo05)。これはNAVIに搭載されたもののサブセット、という感じではあるが、Raven Ridge/Picassoに搭載された初代VCN(Video Core Next)からは高速化されている、という話である。
CPUコアも、勿論Zen世代に比べれば省電力化が進んでいるが、こちらはデスクトップと変わらないので割愛するとして、Infinity Fabricに関してがこちら(Photo06)。外部へのI/F(つまりI/O Chipletとの接続)を考慮する必要が無い分、ドライバをより省電力で実装可能となり、更にバス幅を増やすことで速度を落としても帯域が確保できる様になった事で、ますます省電力化が可能になったという形だ。ここはデスクトップ向けと全く異なる実装であり、それもあってデスクトップ/サーバー向けの既存のZen 2のCPU Chipletの再利用をしなかった(というか、出来なかった)ものと考えられる。
SoC全体としても、従来比で20%の消費電力が削減でき、またCPU Offに入るまでの時間を1/5にしたとしている(Photo07)。
また、ハードウェアというよりもファームウェア側の対策という気もするが、ACPI 6.3に準じる形でC Stateの深さを選択できる様になった(Photo08)。ACPI 6.3ではこれはLPI(Low Power Idle)Stateとして追加されたものだが、要するにOSがアプリケーションの負荷状況を見て、CC1据え置きにするか、CC6までで止めておくか、Vdd Ooffまで行くかを選択できる様にできるというものだ。従来はIdleになると一定時間後にCC6、ついでCPU offを経てVdd Offになる訳だが、CC6からCC1への復帰にはちょっと時間が掛かるし、Vdd Offまで行くと猛烈に時間が掛かる。なので中途半端に省電力モードに入ってしまうと、そこからの復帰に手間取ることになる。そこでOS側で、どのレベルの省電力モードに入るかを調整できるというのがRenoirの特徴で、これにより待機時間を最小にできる、とする。
気になるChipset Functionの方だが、こんな感じ(Photo09)になっている。Picasso世代との大きな違いは、同じパッケージサイズながら
- メモリ帯域の高速化
- PCIeを4レーン増やした
- USBポートを2つ増やした
というあたりである(Photo10)。ここでLPDDR4Xについては、仮想的に内部で一つのメモリコントローラを2chに分割する形で、x32構成をサポート出来るとする(Photo11)。またUSBではMST(Multi Stream Transport)をサポートしており、このため2つのモニターを同時にサポートできるとする(Photo12)。このDisplay周りでちょっと興味深いのは、AIDA(AMD Integrated Device Translation)と呼ばれる機構であるが、要するにRenoirではGPUとGPUが同じメモリ領域をフレームバッファとしてアクセス可能なので、バッファメモリを二重持ちする必要がなく、これによりよりメインメモリを広く使える、という事の様だ(Photo13)。
最後にダイ全体の写真(Photo14)を。ダイサイズは筆者は140平方mm台と推定していたが、もうちょっと大きく156平方mmとなっている。Matisse(つまりZen 2ベースのRyzen 3000シリーズ)のCPU Chipletのサイズが74平方mmだから、これ2つ分よりも大きい。Matisseの場合はI/O Chipletの125平方mmの分を加味する必要があるが、N7プロセスの生産コストが12LPプロセスの概ね倍と考えると、Matisseは7nm換算で137平方mmになる訳で、つまりCPU Chipletが一つのMatisseよりもRenoirの方がややチップの原価は高いという事になる。これはちょっと意外であった。そのダイ写真のアップがこちら(Photo15)。GPUエリアの面積の小ささがちょっと特徴的である。