2024年1月9日に、NVIDIAの最新GPU「GeForce RTX 40 SUPER」シリーズとして3モデルが発表された。1月17日にGeForce RTX 4070 SUPERが発売、1月24日にGeForce RTX 4070 Ti SUPERが発売、そして3週連続リリースの最後を飾るのが1月31日に発売となったGeForce RTX 4080 SUPERだ。
今回はNVIDIAの貸与機材を用い、RTX 4090 / RTX 4080 / 4070 Ti SUPER / 4070 Ti / 4070 SUPER/RTX 4070とシリーズをズラリと揃え、パフォーマンスや消費電力、AI性能を比較していく。
他のRTX 40 SUPERとは異なる傾向のRTX 4080 SUPER
「GeForce RTX 40 SUPER」シリーズは、SUPERの付かないモデルの強化版という位置付け。例えば、RTX 4070 SUPERはRTX 4070に対してCUDAコア数が約20%も増加して性能もそれに準じて大きく向上したが、そのぶん価格も高くなった。しかし、RTX 4080 SUPERの事情はちょっと異なっている。スペックは以下の表にまとめたので確認してほしい。
GPU名 | RTX 4090 | RTX 4080 SUPER | RTX 4080 |
---|---|---|---|
CUDAコア数 | 16,384 | 10,240 | 9,728 |
ベースクロック | 2230MHz | 2205MHz | 2210MHz |
ブーストクロック | 2520MHz | 2550MHz | 2510MHz |
メモリサイズ | GDDR6X 24GB | GDDR6X 16GB | GDDR6X 16GB |
メモリバス幅 | 384bit | 256bit | 256bit |
RTコア | 第3世代 | 第3世代 | 第3世代 |
Tensorコア | 第4世代 | 第4世代 | 第4世代 |
アーキテクチャ | Ada Lovelace | Ada Lovelace | Ada Lovelace |
DLSS | 3 | 3 | 3 |
NVENC | 第8世代×2 | 第8世代×2 | 第8世代×2 |
カード電力 (W) | 450 | 320 | 320 |
システム電力要件 (W) | 850 | 750 | 750 |
電源コネクタ | 8ピン×3または450W以上の12VHPWR×1 | 8ピン×3または450W以上の12VHPWR×1 | 8ピン×3または450W以上の12VHPWR×1 |
RTX 4080に対して、CUDAコア数が9,728基から10,240基と約5%の増加、ブーストクロックが2,510MHzから2,550MHzと微増。2次キャッシュ量は64MBと据え置き、ビデオメモリ量やメモリバス幅、カード電力も同じとほかのSUPERに比べてスペックの差が非常に小さいのだ。性能にあまり変わりがないのはベンチマーク前から想像に難くない。
“SUPER”ということで、上位モデルであるRTX 4090にどこまで近づけるか期待した人もいるかもしれないが、残念ながらその差は全然縮まっていない。スペック表を見ても、RTX 4090は圧倒的に突き抜けた存在であることにまだまだ変わりはないというところだ。
だから、というワケではないだろうが大きく変わったのは価格だ。NVIDIAのメーカー希望小売価格として、RTX 4080は1,199ドルだったが、RTX 4080 SUPERは999ドルと200ドルもの大幅な値下げが行われている。日本円だとRTX 4080は初出時219,800円からに設定されていたので、今回投入されるRTX 4080 SUPERの162,800円という価格はかなりの値下がりといってよい。
現在市場に出ているRTX 4080は18万から22万円が中心だ。実際発売される各メーカーの価格は原稿執筆時点では不明だが、1~2万円は安くなると予想する。RTX 4080の販売は終息するという情報もあるので、順次置き換わっていくだろう。
そのほか、Ada Lovelaceアーキテクチャの採用など基本的な特徴はこれまでのRTX 40シリーズと同じだ。特徴についてはRTX 4090のレビュー『「GeForce RTX 4090」の恐るべき性能をテストする - 4K+レイトレで高fpsも余裕のモンスターGPU』で確認してほしい。
性能テスト前に、GeForce RTX 4080 SUPER Founders Editionを紹介しておこう。NVIDIAのリファレンスと言えるカードなので、カード電力、ブーストクロックとも定格だ。デザインはGeForce RTX 4090 Founders EditionやGeForce RTX 4080 Founders Editionと同じだが、GeForce RTX 4070 SUPER Founders Editionと同様にブラック基調のカラーリングに変わっている。
RTX 4080との差はごくわずか。4Kゲーミングを余裕でこなせるパワーは健在
さて、性能チェックに移ろう。テスト環境は以下の通りだ。Resizable BARは有効にした状態でテストしている。比較対象としてGeForce RTX 4090、GeForce RTX 4080、GeForce RTX 4070 Ti SUPER、GeForce RTX 4070 Ti、GeForce RTX 4070 SUPER、GeForce RTX 4070を用意した。
CPUのパワーリミットは無制限に設定。ドライバに関しては、RTX 4090が「Game Ready 551.23」、RTX 4080 SUPERが「Game Ready 551.22」、RTX 4080/RTX 4070 Ti SUPERが「Game Ready 551.15」、RTX 4070 SUPERが「Game Ready 546.52」、それ以外は「Game Ready 546.33」を使用している。1週間ごとに解禁が迫るタイトなスケジュールの都合上、ドライバのバージョンが混在している点は申し訳なく思う。機会を見て、ドライバを統一しての再テストを行いたい。
- CPU:Intel Core i9-13900K(24コア32スレッド)
- マザーボード:MSI MPG Z790 CARBON WIFI(Intel Z690)
- メモリ:Micron Crucial DDR5 Pro CP2K16G56C46U5(PC5-44800 DDR5 SDRAM 16GB×2)
- システムSSD:Western Digital WD_BLACK SN850 NVMe WDS200T1X0E-00AFY0(PCI Express 4.0 x4、2TB)
- CPUクーラー:Corsair iCUE H150i RGB PRO XT(簡易水冷、36cmクラス)
- 電源:Super Flower LEADEX V G130X 1000W(1,000W、80PLUS Gold)
- OS:Windows 11 Pro(22H2)
今回はビデオカードの消費電力を実測できるNVIDIAの専用キット「PCAT」を使用し、ゲーム系のベンチマークではカード単体の消費電力も合わせて掲載する。
まずは、3D性能を測定する定番ベンチマークの「3DMark」から見ていこう。
RTX 4080に対して1~2%のスコア向上だ。Time Spyのようにほぼ変わらないテストもあり、誤差レベルと言ってもよいほど。一方、上位モデルのRTX 4090と比べると30%以上の差を付けられているテストもあり、その差は歴然だ。RTX 4090が特別なモンスターGPUであることが再確認できる。
次は、実際のゲームでの性能を見てみよう。軽めのFPSゲームタイトルとして「レインボーシックス シージ」と「Apex Legends」を実行する。アップスケーラーは使用せず、ラスタライズの性能をチェックしてみよう。レインボーシックス シージはゲーム内のベンチマーク機能を実行、Apex Legendsはトレーニングモードの一定コースを移動した際のフレームレートをそれぞれ「FrameView」で測定している。
レインボーシックス シージのフルHDではあまりに軽すぎて、GPUに負荷がかかりきらず安定しないので参考値としてほしい。RTX 4080に対して、WQHDと4Kで1%ちょっとフレームレートが上回った。CUDAコア数増加分が効いていると思いたいところ。
Apex Legendsはフレームレート制限を解除するコマンドを使っても最大300fpsまで。RTX 4080 SUPER / RTX4080は、WQHDまでほぼ条件に達している。RTX 4090は4Kでもほぼ上限という恐るべき性能だ。RTX 4080 SUPERとRTX4080は、ほとんど変わらないフレームレートだが、カード単体の電力消費で見るとRTX 4080 SUPERのほうが若干小さくなった。
続いて、アップスケーラーのないタイトルとして「ストリートファイター6」と「ARMORED CORE VI FIRES OF RUBICON」を実行しよう。ストリートファイター6はCPU同士の対戦を実行した際のフレームレート、ARMORED CORE VI FIRES OF RUBICONはミッション「武装採掘艦破壊」で一定コースを移動した際のフレームレートをそれぞれ「FrameView」で測定している。
ストリートファイター6は120fpsまで設定できるが対戦時は60fpsまでになる。今回使用したGPUならば、すべて最高画質設定でも4Kまで快適にプレイが可能だ。WQHDでは、RTX 4080 SUPERがもっとも低消費電力というワットパフォーマンスのよさを見せた。
ARMORED CORE VI FIRES OF RUBICONは、最大120fpsだ。ここでもRTX 4080 SUPER/RTX4080はほぼ同じフレームレートだ。ただ、ストリートファイター6と同じくRTX 4080 SUPERはWQHDで優秀なワットパフォーマンスを見せている。
DLSS 3対応ゲームでテスト! 超重量級ゲームでも4Kで快適に遊べる
次は、DLSS 3(アップスケール&フレーム生成)に対応したゲームでフレームレートを測定していく。DLSS 3はRTX 40シリーズだけで利用できる描画負荷軽減技術。非常に優秀だが、ゲーム側の対応を必要とするのがネックと言える。
まずは、人気レースゲームの「Forza Horizon 5」を実行する。画質はプリセットの最上位を設定し、DLSSはパフォーマンスとし、フレーム生成を有効化している。ゲーム内蔵のベンチマーク機能を実行した際のフレームレートを「FrameView」で測定している。
RTX 4080よりも若干ではあるが、フレームレートが下回った。消費電力もRTX 4080 SUPERのほうが小さいので、うまく負荷がかかりきれなかったのかもしれない。このあたりはドライバーのバージョンを統一して再テストが必要と言えるだろう。
次は、重量級タイトルとして「Starfield」と「サイバーパンク2077」でフレームレートを見てみよう。同じく画質のプリセットは最上位にし、DLSSはパフォーマンス、フレーム生成を有効化した。サイバーパンク2077については、レイトレーシングの画質を向上させるDLSS 3.5の機能「Ray Reconstruction」も有効化している。Starfieldはジェミソンのロッジ周辺の一定コースを移動した際のフレームレート、サイバーパンク2077はゲーム内のベンチマーク機能を実行した際のフレームレートをそれぞれ「FrameView」で測定した。
Starfieldは165fps前後で頭打ちになるようだ。RTX 4080 SUPER / RTX4080はWQHDまで上限に到達、RTX 4090は4Kでもほぼ到達とここまでのテストと同じ傾向と言える。カード単体の消費電力はRTX 4080 SUPERがRTX 4080を下回った。全体として、ワットパフォーマンスは優秀と言ってよいだろう。
サイバーパンク2077は、すべての光をシミュレートする“フルレイトレーシング”とも呼ばれ、描画負荷が強烈に高い「レイトレーシング:オーバードライブ」に設定している。RTX 4080 SUPER / RTX4080はほとんど同じフレームレートで、4Kでも平均80fps以上とフルレイトレーシングの美しさを滑らかな描画で楽しめる。
CGレンダリングやStable Diffusionでも性能を比較してみる
ここからはCGレンダリングやAI処理を試していく。まずは、3DCGアプリの「Blender」を使ってGPUによるレンダリング性能を測定する「Blender Open Data Benchmark」を実行する。
一定時間内にどれほどレンダリングできるのかをスコアとして出すベンチマークだ。RTX 4080よりも微増となった。それよりもRTX 4090は30%もスコアで圧倒しており、ここでもモンスターぶりを見せつけた。
次は「Procyon AI Inference Benchmark for Windows」を実行する。MobileNet V3、Inception V4、YOLO V3、DeepLab V3、Real-ESRGAN、ResNet 50と複数の推論エンジンを使ってAIの総合的なパフォーマンスを測定するベンチマークだ。Windows MLとNVIDIA TensorRTでテストした。
RTX 4080とは誤差レベルの差だ。ここでもRTX 4090の強さが見えてしまう。
続いて、画像生成AIとしてStable Diffusionを実行してみたい。AUTOMATIC1111版Stable Diffusion web UIにTensorRT拡張を導入し、Stable Diffusion XLで1024×1024ドット、Stable Diffusion 1.5で512×512ドットの画像サイズで1分間に何枚の画像を生成できるかテストを行った。Sampling Methodは「Euler a」、Sampling Stepsは「50」、CFG Scaleは「7」、Batch Sizeは「1」、Batch Countは「10」に設定、シード値も固定している。
RTX 4080よりもわかりやすく差が出ており、画像処理では高速であることがわかる。とくにStable Diffusion 1.5による画像生成では約7%も高速で、今回のテストで一番の差となった。
NVENCによるハードウェアエンコードの速度もチェックしよう。動画編集アプリの「DaVinci Resolve STUDIO 18.6」を使って、Apple ProResの4K素材を使ったプロジェクト(約2分)をH.265とAV1にNVENCを使って変換する速度を測定した。品質:80Mbps/Rate Control:固定ビットレート/Preset:速度優先の設定でエンコードを実行している。
RTX 4090/RTX 4080 SUPER/RTX 4080/RTX 4070 Ti SUPER/RTX 4070 Tiは同じ世代のNVENCを2基搭載しており、DaVinci Resolve STUDIO 18.6はそれを同時使用するデュアルエンコードが可能だ。処理時間は短く、同じ世代のNVENC搭載モデルでは差もほとんどない。RTX 4070 SUPERとRTX 4070は同じNVENCが1基搭載なので、その分遅くなっている。
FE版のクーラーはとても優秀。3スロット厚のクーラーでよく冷える
最後に温度とクロックの推移をチェックしよう。サイバーパンク2077を10分間プレイした際の温度と動作クロックの推移を「HWiNFO Pro」で測定している。GPU温度は「GPU Temperature」、クロックは「GPU Clock」の値だ。室温は22度。バラック状態で動作させている。
ブーストクロックは2,730MHz前後で推移。仕様上のブーストクロック2,550MHzなので、ゲーム中は高めのクロックで動作している。冷却クーラーは3スロット厚とRTX 4080クラスとしては厚めではないが、最大63.3度、平均60度とバッチリと冷えている。
RTX 4080 SUPERは、RTX 4080に対してCUDAコア数が微増というスペックの差が小さいこともあってフレームレートは1~2%ほどしか変わらないケースがほとんど。しかし、価格は下がるとみられるので、“お買い得になったRTX 4080”と言える。SUPER感はないのが残念だが、4K&高画質でバリバリ遊べるGPUがちょっとでも買いやすくなったのは歓迎すべきことだろう。