◆Shadow of the Tomb Raider(グラフ68~76)

Shadow of the Tomb Raider
SQUARE ENIX
https://tombraider.square-enix-games.com/en-us

ベンチマーク方法はこちらに準じる。ところでこのShadow of the Tomb Raiderでちょっと面白い(いやShadow of the Tomb Raiderそのものに関わる話では無いのだが)話がある。Shadow of the Tomb RaiderはSuper SamplingとしてDLSSとXeSSに対応している(XeSSは後追いで追加された)のだが、FSRは未対応である。なのだが、実はRadeon RX 7900シリーズではXeSSが利用可能なのである。

何故? という話であるが、実はXeSSはDirectX 12でサポートされるShader Model 6.4で提供されるDot-Products 2/4のAPIを利用しているからだ。もっと正確に言えば、XeSSはMicrosoftがWindows向けに提供しているDirectML(Direct Machine Learning)というML向けのフレームワークを利用して実装されており、このDirectMLが内部でShader Model 6.4を利用している(=Shader Model 6.4で提供されるDot-ProductsのAPIを呼んでいる)ため、Shader Model 6.4に対応し、かつDot-ProductsのAPIが提供されていれば、必ずしもIntel ArcシリーズでなくてもXeSSが使えるという事になる。実際、Shader Model 6.6に対応している(=Shader Model 6.4もサポート)のRadeon RX 6600でShadow of the Tomb Raiderを起動すると、XeSSの選択が可能になる(Photo16)し、ちゃんと動作する(Photo17)。これに未対応のGeForce RTX 4080の場合、XeSSはOffのまま選べなくなって(Photo18)いることから、ちゃんと内部でShader Model 6.4との互換性をチェックして判断している訳だ。

  • Photo16: Radeon RX 6600でもXeSSは利用できる。もっともDot-Productsのアクセラレータが無いので、XeSSを使っても結構遅い。

  • Photo17: Result画面より。Intel XeSSがUltra Qualityになっているのがお分かりかと思う。

  • Photo18: GeForce RTX 4080だとXeSSはOffのまま選べない。まぁDLSSを使えばいいのだが。

そんな訳でRadeon RX 7900ではXeSSを利用できるわけだが、Radeon RX 6600と異なりRadeon RX 7900というかRDNA 3にはWMMA(Wave Matrix Multiply Accumulate)という機能が追加されており、RDNA 2世代に比べてDot-Productsの演算を遥かに高速に実行する事が出来る。先の記事ではこのAPIが不明と書いたが、どうもAMDはShader Model 6.4にあるdot4add_u8packed()/dot4add_i8packed()/dot2add()といったAPIからこのWMMAを呼び出せるようにしているようで、ということはXeSSを利用すると内部的にはこのWMMAが動く形でMLベースのSuperSamplingが行える、という訳だ。

話が長くなったがそんな訳でShadow of the Tomb RaiderについてはSuper SamplingはDLSS及びXeSSを利用して実施する事にした。

そんな訳で実際のテスト項目だがGraphics TabのPresetはHightestとした上で

解像度 2K/2.5K/3K/4K Ray Traced Shadow Quality:Off のテストを行い、更に

解像度 4K Ray Traced Shadow Quality:Ultra
解像度 4K Ray Traced Shadow Quality:Ultra+Super Sampling(DLSS Super Quality/XeSS Super Quality)

での比較を行ってみた。

  • グラフ68

  • グラフ69

  • グラフ70

  • グラフ71

  • グラフ72

  • グラフ73

  • グラフ74

  • グラフ75

  • グラフ76

まずRay Tracing無しのOverall(グラフ68~70)だが、珍しく

Radeon RX 7900 XT < Radeon RX 7900 XTX < GeForce RTX 4080

という構図になった。Ray Tracingありは珍しくないが、無しでここまで性能差が出るのは初めてだと思う。

もっともフレームレート変動(グラフ71~74)を見ると、例えば2Kだと15秒付近や40付近、80~140秒などはあまり差は見られず、主に0~15秒とか20~40秒、45~80秒といった比較的負荷が軽い部分で性能差が出ている格好だ。その意味では、性能差は間違いなくあるものの、それが体感できるほど差が出るか?というとそうでもない様に思える。

さて問題のRay Tracingである。グラフ75がOverallだが平均フレームレートを拾うと

Ray Tracingなし Ray Tracingあり Ray Tracing+SS
GeForce RTX 4080 135.1fps 88.4fps 135.8fps
Radeon RX 7900 XT 108.6fps 65.9fps 84.9fps
Radeon RX 7900 XTX 128.6fps 77.9fps 97.8fps

ということで、

  • Ray Tracingの負荷はそれなりに大きい
  • DLSSだと意外に性能が伸びるが、XeSSは今一つ。とは言えないよりはずっとマシ。

といった結果になった。ただフレームレート変動(グラフ76)を見ると、例えばGeForce RTX 4080だとRT+DLSSがRTなしをはっきり上回っているのは負荷の軽い70~110秒(と一時的に20秒付近)で、それ以外の箇所ではむしろRTなしを下回っている訳で、単純にDLSSで性能が持ち上がる、とも言いにくい。まぁそれでも平均値で同等だから、GeForce RTX 4080はDLSSのSuper Qualityで十分使い物になるが、Radeon RX 7900はもうQuality/Balancedあたりを狙わないとやや不満が残る、というあたりだろうか。まぁFSRでなくXeSSを使っている事が問題と言えば問題なのだろうけど。

◆Tom Clancy's The Division 2(グラフ77~83)

Tom Clancy's The Division 2
Ubisoft
https://www.ubisoft.co.jp/division2/

ベンチマーク方法はこちらの"Tom Clancy's The Division 2"に準ずる。設定は

品質:ウルトラ

とした。こちらはRay TracingもSuper Samplingも未対応である。

  • グラフ77

  • グラフ78

  • グラフ79

  • グラフ80

  • グラフ81

  • グラフ82

  • グラフ83

ということで結果であるが、Overall(グラフ77~79)で見ると

Radeon RX 7900 XT < Radeon RX 7900 XTX ≦ GeForce RTX 4080

といったところ。Radeon RX 7900 XTXはかなり健闘しているものの、GeForce RTX 4080に一歩及ばずというあたり。Radeon RX 7900 XTは明確に差がついてはいるものの、例えば4Kでも94.4fpsなのだからこれまでのGPUに比べればかなり高速である事は間違いないし、2Kでの他との差はかなり少ない。

実際フレームレート変動(グラフ80~83)を見ると、2KでRadeon RX 7900 XTが他より下回っているとはちょっと思えないほど。2.5/3Kでは流石にRadeon RX 7900 XTは明確にグラフが分離するが、Radeon RX 7900 XTXはそれでもまだ差は大きくない(60sec以降はちょっと離れるが)。4KではRadeon RX 7900 XTXとGeForce RTX 4080の差は再び縮まっており、一応どちらが上かと言えばGeForce RTX 4080となるが、Radeon RX 7900 XTXも言うほど性能差はない感じだ。

◆Watch Dogs:Legion(グラフ84~90)

Watch Dogs:Legion
Ubisoft
https://www.ubisoft.co.jp/wdlegion/

ベンチマーク方法はこちらの"Watch Dogs:Legion"に準ずる。こちらもSuper SamplingはDLSSのみサポートということで今回は

Quality;Ultra RT Reflection:Off DLSS:Off

の条件で比較した。

  • グラフ84

  • グラフ85

  • グラフ86

  • グラフ87

  • グラフ88

  • グラフ89

  • グラフ90

Overall(グラフ84~86)で見ると傾向はThe Division 2に近く、2KではRadeon RX 7900系が高速だが、そこから急速にフレームレートを落としてゆくのに対し、GeForce RTX 4080はその落ち方が緩やかであり、結果4Kではかなりの性能差になっている。なのでトータルで見れば

Radeon RX 7900 XT < Radeon RX 7900 XTX < GeForce RTX 4080

としてしまって差し支えないだろう。

フレームレート変動(グラフ87~90)もこの傾向を裏付けており、2Kは大差ないのがどんどん差がつき、4Kでは3本のグラフが完全に分離しているし、その差もかなり大きい。これに関してはGeForce RTX 4080の勝利、としてしまって良い様に思える。