米AMDは11月3日(日本時間の11月4日)、オンラインにてRadeon RX 7000シリーズを発表した。発表会の模様はこちらから視聴可能だが、ここで説明された内容を詳しくレポートしたい。

Radeon RX 7000シリーズは、Consumer GPUとしては初のChiplet構成となった。そのChiplet構成であるが、5nmプロセスで製造されたGCD(Graphics Compute Die)と、6nmプロセスで製造されたMCD(Memory Cache Die)×6という構成である。もっともこの6つのMCDは最大構成であって、SKUによって減る(後述)ことになる(Photo01)。GCDは300平方mm、MCDは一つ37平方mmなので、全体の合計は522平方mmに達する計算になる。これをモノリシックなダイで構成したらかなり高コスト&低Yieldに悩まされそうだが、この方式だとそうした問題とは無縁である。

  • AMD Radeon RX 7000シリーズの「RDNA 3」 初のChiplet構成、性能1.5倍の中身

    Photo01: 筆者はMulti-Dieの噂について、一つのMCDと複数のGCD構成を想定していたので、見事に予想が外れた。

  • Photo02: 尤もMCDとGCDではプロセスが異なるから、モノリシック換算だとMCDも5nmで製造する想定になるが、それでも1個30平方mmを切ることはないだろうから、500平方mmを超えることは間違いない。

さてその基本となるチップ、61TFlopsの演算性能と5.3TB/secの帯域を持つMemory/Cache、24GBのGDDR6という構成となる。内部構造は後回しにして、まず製品であるが、96CU、24GB MemoryのRadeon RX 7900 XTXと80CU、20GB MemoryのRadeon RX 7900 XTの2製品が用意される(Photo04)。

  • Photo03: この61TFlopsであるが、FP32の場合である。計算などは後述。

  • Photo04: ちなみに予想通り、Radeon RX 7900 XTではMCDは5つになるとのこと。

性能/消費電力比はRDNA 2と比べて最大54%向上としている(Photo05)。Infinity Cacheの帯域はRDNA 2比で最大2.7倍に達し(Photo06)、またトランジスタ密度もRDNA2比で65%増に達しているとする(Photo06)。このトランジスタの増分を、そのままCUの演算性能倍増に割り当てた格好だ(Photo08)。ちょっと分りにくいが、RDNAシリーズのCUの演算ユニットの構造を並べると

RNDA 1 16way SIMD×4/CU
RDNA 2 32way SIMD×2/CU、2CU/WGP
RDNA 3 32way SIMD×4/CU、2CU/WGP(推定)

ということになる。要するにRadeon RX 7900 XTXは96CUとされているが、それぞれのCUの演算性能が倍になっているので、RDNA 2的に言えば192CU相当になっている訳だ。また新たにゲーム向けのAI AcceleratorをDualで搭載した(Photo09)ほか、第2世代のRay Tracing Acceleratorを搭載したとする(Photo10)。

  • Photo05: この54%の内訳は、現時点では公開されていない。

  • Photo06: 各々のMCDにそれぞれ64bitのGDDR6コントローラが搭載されている模様。

  • Photo07: これはプロセスの微細化のお陰である。

  • Photo08: Warpそのものは変わっていない(Warp32)と思われるので、つまりRDNA 2では1つのCUがWarp32を2つハンドリングできたのに対し、RDNA 3では4つハンドリングできることになる。

  • Photo09: これはNVIDIAでいうところのTensor Core的なものになる。

  • Photo10: 従来比で50%性能向上というのは頼もしいが、それでもこれでNVIDIAに勝てるのか? というとちょっと怪しい気が。

また出力エンジンは8K165fpsや4K480fpsを可能とする、DisplayPort 2.1準拠のものになり(Photo11)、またMedia EngineもついにAV1 Encode/Decodeに対応した(Photo12)。AI Enhanced Video Encodeについては現時点では詳細が明らかにされていない。

内部構造でもう一つ、Front-endとShaderで別々のクロック動作が可能になり、高速動作と省電力性が共に向上した、としている(Photo13)。

  • Photo11: これが3つ搭載される。

  • Photo12: AVC/HEVCについてはエンコードとデコードの同時実行が可能。

  • Photo13: 昔のNVIDIAのGPUも確かDecouple構成だった気がする。

ところで先にPhoto03で出てきた61TFlopsであるが(Photo14)、比較対象のRDNA 2が23TFlopsとされている。こちらに示されているように、RDNA 2の23TFlopsはピーク性能であり、これはGame Clockの2.1GHz駆動ではなくBoost Clockの2.31GHzの場合の数字である。なのでRDNAについてもGame Clockの2.3GHzではなくもう少し高い動作周波数の場合と想像される。簡単に試算すると、

96CU×4 SIMD×32wide×2(Flops/cycle)×2.54GHz=60.96TFlops

ということで、おそらくShaderはGame Clockこそ2.3GHzなものの、Boost Clockは2.54GHz付近まで上昇するものと考えられる。

  • Photo14: まぁConsumer向けだからFP64のことは基本考えてなさそうである。

さてRadeon RX 7900 XTXの性能は、Radeon RX 6950XT比で1.5~1.7倍の性能とされる(Photo15)。そのRadeon RX 7900 XTXのスペックがこちら(Photo16)。TBPは「わずか」355Wである。その下のグレードがRadeon RX 7900 XTでこちらは80CUになる。メモリも320bit幅で、それもあってこちらはMCDが5つとなっているそうだ。消費電力が低めだから、相変わらず2.5スロット厚だし、カードの長さもそれほどではない(Photo18)。

性能というかリフレッシュレートでいえば、より高リフレッシュレート動作が可能になった(Photo19)結果、FSRなどを適時組み合わせることで、DisplayPort 1.4の上限を超える表示が可能になったとされる(Photo20,21)。Ray Tracingに関しては。まだFSRを使って性能底上げを図らないと実用に耐えない感じではあるが(Photo22)。

  • Photo15: 右半分はRay Tracingの場合である。

  • Photo16: 曰くアップグレード時に「新しいケースを買ったり、電源を交換したりする必要はない」。まぁGeForce RTX 4090を念頭に置いたセリフだろう。

  • Photo17: こちらはさらに穏当な、TBP 300W。

  • Photo18: また電源コネクタは8pin×2。一応PCI Expessのスペック上はこの構成で375Wまでは大丈夫な筈である。

  • Photo19: 1440Pでは遂に最大900fpsである。

  • Photo20: 4K Gamingの場合

  • Photo21: 8K Gamingの場合

  • Photo22: まぁFSRと併用すればDXRTが使い物になる、という話でもある。

ソフトウェアの面では、新たにHYPR-RX(Photo23)とFSR 3(Photo24)の予告があった。最後の価格と発売日だが、それぞれ$999と$899で、12月13日に発売予定である。

最後に会場で展示されたRadeon RX 7900 XTXの写真をご紹介したい(Photo26~30)。

  • Photo23: フレームレート向上とレイテンシ削減を両立する、というものだが具体的な説明はまだなし。

  • Photo24: こちらも詳細は不明。HYPR-RXと異なりゲーム側の対応が必要と思われるので、投入時期は一応2023年中とされるが、正確なところはまだ不明。

  • Photo25: 日本での販売価格はまだ当然不明。

  • Photo26: この角度から見るとRadeon RX 6900シリーズと見分けがつかない。下に伸びてるリードは、展示機で無理やりファンの周囲の照明を点灯させるためのもの。

  • Photo27: 背面はフルカバード。

  • Photo28: DisplayPort×2、HDMI×1構成。USB Type-CポートはRadeon RX 7900 XTXでも健在。

  • Photo29: 補助電源はこの通り8pin×2。もっともOEMメーカーの中には×3構成をとるところもありそうだが。

  • Photo30: チップのアップ。確かに中央に大きなGCDが配され、その周囲に小ぶりのMCDがあるのが判る。