2022年10月12日の22時から発売が開始されるNVIDIAの最新GPU「GeForce RTX 4090」。発売に先立って「GeForce RTX 4090 Founders Edition」を試用する機会を得たので、さっそくその実力をチェックしたい。

  • GeForce RTX 4090 Founders Edition。価格の目安は29万8,000円からとなっているが、日本での発売予定はない

    GeForce RTX 4090 Founders Edition。価格の目安は29万8,000円からとなっているが、日本での発売予定はない

■GeForce RTX 4000シリーズのスペック
GPU名 RTX 4090 RTX 4080(16GB) RTX 4080(12GB)
CUDAコア数 16,384 9,728 7,680
ベースクロック 2230MHz 2210MHz 2310MHz
ブーストクロック 2520MHz 2510MHz 2610MHz
メモリサイズ GDDR6X 24GB GDDR6X 16GB GDDR6X 12GB
メモリバス幅 384bit 256bit 192bit
RTコア 第3世代 第3世代 第3世代
Tensorコア 第4世代 第4世代 第4世代
アーキテクチャ Ada Lovelace Ada Lovelace Ada Lovelace
DLSS 3 3 3
NVENC 第8世代×2 第8世代×2 第8世代×2
カード電力 (W) 450 320 285
システム電力要件 (W) 850 750 700
電源コネクタ 8ピン×3または450W以上の12VHPWR×1 8ピン×3または450W以上の12VHPWR×1 8ピン×2または300W以上の12VHPWR×1

GeForce RTX 4090は、2022年9月20日に発表された「GeForce RTX 4000」シリーズの最上位モデル。価格の目安は29万8,000円から非常に高価で、最強性能を追求するエンスージアスト向けのGPUだ。すでにマイナビニュースではスペックや機能などに関する解説記事を掲載しているので、まずは注目ポイントを簡潔に紹介しておきたい。

まず、一つが新アーキテクチャ「Ada Lovelace」の採用だ。製造プロセスを前世代のSamsung 8NからTMSC 4Nに変更され、微細化が進んだこともあり、搭載CUDAコア数は16,384基に達した。前世代のRTX 3000シリーズもCUDAコア数の多さが特徴だったが、最上位のGeForce RTX 3090 Tiでも10,752基。CUDAコア数だけでも、RTX 4090のモンスターぶりが分かるというもの。レイトレーシング用のRTコアは第3世代に、深層学習に特化したTensorコアは第4世代になり、それぞれの性能も大幅に強化されている。

  • 新アーキテクチャ「Ada Lovelace」を採用。RTコアは第3世代、Tensorコアは第4世代になり、CUDAコア数も大幅に増加した

二つ目が「DLSS 3」への対応だ。4K/WQHDなど高解像度ディスプレイの普及、リアルな光の反射を再現するレイトレーシングの登場などゲームの描画負荷が高まる中、それを軽減してフレームレートを高めるアップスケーラーの重要性が高まってる。AMDの「FSR」やIntelの「XeSS」など各社とも力を入れてアップスケーラーを開発しているが、NVIDIA独自の「DLSS」はRTXシリーズに搭載されるTensorコアを活用して、高いフレームレートの向上と高画質を両立できる技術として有名だ。すでに使っている人も多いのではないだろうか。そのDLSSにフレーム生成技術を追加し、よりフレームレートを高められるようにしたのがDLSS 3だ。ここでは、その性能についても検証したい。ちなみに、DLSS 3は第4世代Tensorコアが必要なので、RTX 4000シリーズでしか使えない。

DLSS 3についてはNVIDIAのバイスプレジデントBryan Catanzaro氏による動画でも解説されている。気になる人は視聴してみるとよいだろう。

NVIDIA DLSS 3 とは何か?AI で性能が飛躍する (日本語字幕付き)

  • 低解像度でレンダリングした映像をアップスケールする従来の技術に加え、フレーム生成を追加して、よりフレームレートを高められるようになったのが「DLSS 3」だ

  • DLSS 3は35以上のゲームやアプリで対応予定となっている

三つ目が「デュアルエンコード」の実現だ。RTX 4090にはハードウェアエンコーダーとして第8世代のNVENCが2基搭載されている。そのため、対応アプリであれば、2基同時のエンコードが可能だ。単純に従来よりエンコード時間を半分にできる。動画編集をやっている人にとっては作業時間をグッと短縮できる機能と言えるだろう。さらに、高圧縮かつ高画質のAV1コーデックのエンコードも新たにサポートされ、動画配信時の画質アップを期待できるなど、使い勝手も向上している。

  • 第8世代のNVENCを2基搭載し、デュアルエンコードを可能にした

そのほか情報を知りたい人は、別記事の

「NVIDIA、「GeForce RTX 4090」と「RTX 4080」を発表 - アーキテクチャは“Ada Lovelace”」(https://news.mynavi.jp/article/20220921-2459360/

「「NVIDIA DLSS 3」発表! “力ずく(brute-force)”のレンダリングより約4倍速い」(https://news.mynavi.jp/article/20220921-2459872/

「「GeForce RTX 4090」がやってきた! Founders Edition製品版を開封の儀!!」(https://news.mynavi.jp/article/20221005-2471760/

も合わせてチェックしてほしい。

性能テスト前にGeForce RTX 4090 Founders Editionを紹介しておこう。NVIDIAの純正カードと呼べる存在で、残念ながら日本での発売は予定されていない。RTX 4090の基本仕様通りの作りで、ブーストクロックは2520MHz、カード電力は450Wに設定されている。

  • GeForce RTX 4090 Founders EditionのGPU-Zによる情報

  • カード電力は450Wに設定されていた

4Kかつ高画質&レイトレーシング設定でも高fpsの衝撃

さて、気になる性能チェックに移ろう。テスト環境は以下の通りだ。Resizable BARは有効にした状態でテストしている。比較対象としてGeForce RTX 3090 TiとGeForce RTX 3090を用意、3DMarkのみRadeon RX 6900 XTも加えている。CPUのパワーリミットは無制限に設定。ドライバに関しては、GeForceはレビュワー向けに配布された「Game Ready 521.90」、Radeonは「Adrenalin 22.10.1」を使用している。

【検証環境】
CPU Intel Core i9-12900K(16コア24スレッド)
マザーボード MSI MPG Z690 CARBON WIFI(Intel Z690)
メモリ Corsair DOMINATOR PLATINUM RGB DDR5 CMT32GX5M2B5200C38(PC5-41600 DDR5 SDRAM 16GB×2)※DDR5-4800で動作
システムSSD Samsung 980 PRO MZ-V8P1T0B/IT(PCI Express 4.0 x4、1TB)
データSSD Kioxia EXCERIA PRO SSD-CK1.0N4P/N(PCI Express 4.0 x4、1TB)
CPUクーラー Corsair iCUE H150i RGB PRO XT(簡易水冷、32cmクラス)
電源 玄人志向 KRPW-PA1200W/92+(1,200W、80PLUS Platinum)
OS Windows 11 Pro(21H2)

まずは、3D性能を測定する定番ベンチマークの「3DMark」から見ていこう。

  • 3DMark

まず、DirectX 11ベースのFire Strikeで5万オーバーというスコアに驚愕する。かなりのインパクトだ。RTX 3090 Tiから約1万もスコアアップを果たした。レイトレーシングの性能を測るPort Royalも2万5,000オーバーを記録。RTX 3090 Tiから約72%もアップと、RTX 3090に対しては2倍以上とRTコアの刷新による性能向上が非常に高いことが分かる。

次は、実際のゲームを試そう。まずは、レイトレーシングやDLSSに対応しないゲームとして「レインボーシックス シージ」と「Apex Legends」を試す。レインボーシックス シージはゲーム内のベンチマーク機能を実行、Apex Legendsはトレーニングモードの一定コースを移動した際のフレームレートをそれぞれ「FrameView」で測定している。

  • レインボーシックス シージ

  • Apex Legends

レインボーシックス シージはGPU性能が高いほどフレームレートが伸びる傾向だが、RTX 4090はフルHDとWQHDでほとんど変わらない状態になった。恐らくフルHDではGPU性能が高すぎて、CPU側の処理が追いつかずフレームレートが伸びなかったと考えられる。ゲームの上限に到達した可能性もあるが。このあたりは機会があれば、別のCPUでもテストしてみたい。

Apex Legendsはフレームレート上限を解除するコマンドを使っても最大300fpsまでしか出ないゲームだ。RTX 4090はフルHDとWQHDはほぼ上限の300fpsで動作、4Kでも平均284fpsに到達とRTX 3090 Tiよりも4Kのフレームレートは100fps以上もアップした。高負荷時の性能向上が顕著だ。

次は、レイトレーシングとDLSS 3の性能を含めたテストをしてみたい。まずは、DLSS 3に対応するベータ版のサイバーパンク2077から。テストは最高画質設定の「レイトレーシング:ウルトラ」をベースに、レイトレーシングライティング設定をもっとも高い「サイコ」にし、ゲーム内のベンチマーク機能を実行した際のフレームレートを「FrameView」で測定している。

  • ベータ版サイバーパンク2077には、DLSS 3の特徴であるフレーム生成を有効にする「DLSS Flame Generation」という項目が追加される

  • サイバーパンク2077

注目は4Kの平均フレームレートだ。RTX 4090は平均38fpsからDLSS 3を有効にすることで平均143fpsと約3.8倍も向上。4K/144Hzの液晶をほぼフル活用できるだけのフレームレートに到達できている。4Kかつ高画質でレイトレーシングをゴリゴリに効かせても滑らかな描画が可能なのはスゴイの一言だ。真の4Kゲーミング時代が来たと言ってよいだろう。

次はDLSS 3に対応するMMOのJustice(ベータ版)を試そう。2022年10月12日のアップデート配信が予定されている新ロケーションの「Fuyun Court」は、すべてのライティングをレイトレーシングで行う“フルレイトレーシング”と言うべき作りが特徴だ。今回はその「Fuyun Court」のデモを実行した際のフレームレートを「FrameView」で測定している。

  • Justiceの新ロケーション「Fuyun Court」ではすべてのライティングをレイトレーシングで行う

  • Justice

ライティングをすべてレイトレーシングで行うのは強烈な負荷だ。RTX 4090でもフルHDで平均49fpsしか出ていない。しかし、DLSSを有効にするとフルHDで約3.6倍の平均174fps、4Kでは約5.3倍の平均80fpsを達成した。DLSS 3の強さが出ている。RTX 3090 TiはDLSSを有効にしても、4Kで約3.4倍のフレームレート向上。それでも平均27fpsしか出ておらず、快適なプレイは難しい。

もう一つ、DLSS 3対応のベータ版が提供された「Microsoft Flight Simulator」を実行しよう。アクティビティの着陸チャレンジから「シドニー」を選び、60秒フライトしたときのフレームレートを「FrameView」で測定している。

  • DLSS 3対応のベータ版ではフレーム生成の「NVIDIA DLSS FRAME GENERARION」が追加される

  • Microsoft Flight Simulator

これはDLSS 3のフレーム生成がどういう場面で活きるのか分かりやすい結果だ。Microsoft Flight SimulatorはGPU性能が高いとCPUの処理が追いつかずフレームレートが伸びない。RTX 4090の各解像度やRTX 3090 Ti/3090のフルHDとWQHDでフレームレートがほとんど変わらないのは、それが理由だ(Core i9-12900Kでも足りないのかい! とは思うが)。CPUがボトルネックになっているため、従来のDLSSでは有効にしてもフレームレートがほとんど伸びない。その一方で、RTX 4090が使えるDLSS 3ではGPU側でフレームを生成するので、CPUで処理が停滞する状況でもフレームレートを伸ばせるのが大きな強み。高負荷なゲームほど活きるのがDLSS 3と言える。

Microsoft Flight Simulatorの場合は、結果からフレームレートの約半分がDLSS(TensorコアよるAI処理)によって作られていることになり、まさに世はAI時代と感じてしまった。

CGレンダリング性能も大幅向上! デュアルエンコードも便利

ここからはクリエイティブ系の処理をテストしていこう。まずは、3DCGアプリの「Blender」を使ってGPUによるレンダリング性能を測定する「Blender Open Data Benchmark」を試す。

  • Blender

一定時間内にどれほどレンダリングできるのかスコアをして出す仕組み。RTX 3090 Tiに対して約2倍のスコアを出しており、Blenderでのレンダリング時間を短縮したい人にとってもRTX 4090は非常に魅力的と言ってよいだろう。

続いて、デュアルエンコードに対応する動画編集アプリの「DaVinci Resolve 18」(テスト版)を使って、Apple ProResの4Kと8K素材を使ったプロジェクト(約2分)をそれぞれH.265とAV1に変換する速度を測定してみた。品質:80Mbps/Rate Control:固定ビットレート/Preset:速度優先の設定でエンコードを実行している。

  • DaVinci Resolve 18 (4K)

  • DaVinci Resolve 18 (8K)

デュアルエンコードの威力は確かだ。2基のNVENCでエンコードするので当然とは言えるが、RTX 3090 Ti/RTX 3090の約半分でエンコードが完了できている。新たに対応したAV1コーデックでもほぼ同じ時間で処理ができており、高圧縮&高画質のコーデックを高速エンコードできるのは大きな強みと言えるだろう。

ワットパフォーマンスも優秀

次はRTX 4090を搭載したシステム全体の消費電力をチェックする。OS起動10分後をアイドル時、3DMark-Time Spy実行時の最大値とサイバーパンク2077実行時の最大値を測定した。電力計にはラトックシステムの「REX-BTWATTCH1」を使用している。

  • システム全体の消費電力

意外にも低いというのが正直な感想だ。システム全体で500W超えは確かに大きい消費電力だが、RTX 3090 Ti使用時には600Wを超えることもあるので、Ada Lovelaceアーキテクチャが前世代のAmpereアーキテクチャよりも約2倍のワットパフォーマンスがあるというNVIDIAの説明はおおむね合っていると言えるだろう。ベンチマークの結果は、RTX 3090 Tiよりも1.5倍から2倍のスコアになることが多いからだ。TSMC 4Nプロセス製造による微細化はワットパフォーマンスの向上にもかなり貢献しているのではないだろうか。

最後に温度とクロック、カード単体の消費電力推移をチェックしよう。サイバーパンク2077を10分間プレイした際の温度と動作クロックの推移を「HWiNFO Pro」で測定している。GPU温度は「GPU Temperature」、クロックは「GPU Clock」、電力は「GPU Power」の値だ。バラック状態で動作させている。

  • 温度とクロック

  • カード単体の消費電力

ブーストクロックはほぼ2730MHzで動作。仕様上のブーストクロック2520MHzなので、ゲーム中はそれよりも若干高いクロックで動作するようだ。Founders Editionの冷却システムは優秀で、最大でも64度とハイエンドGPUとしては低いと言える。カード単体の消費電力はおおむね340Wから345Wで推移。仕様上は450Wなので、少なくともサイバーパンク2077のプレイではそこまで高くならなかった。

と、ここまでがGeForce RTX 4090 Founders Editionのテスト結果だ。RTX 3090 Tiから大きな性能向上が確認でき、DLSS 3対応のゲームでは強烈なフレームレート向上が見られた。デュアルエンコード対応で動画のエンコードも短縮でき、まさに2022年10月現在で“最強”と言えるGPUに仕上がっている。もちろん、非常に高価なカードなので誰にでもオススメできるわけではないが、“これは欲しい”と思わせるパワーを見せてくれたのは間違いない。RTX 4000シリーズのほかのモデルの性能も早く試したみたいところだ。