◆PCMark 10 v2.1.2177(グラフ69~74)
PCMark 10 v2.1.2177
UL Benchmarks
https://benchmarks.ul.com/pcmark10
一応こちらも。といっても、基本的に2D描画だから本来性能差はほぼない筈だし、実際あまり違うがなかった。まず一つ大きいのはグラフ70におけるGamingだが、これは中で3DMarkのFireStrikeを実行しているだけだから、まぁ差があって当然である。またこのグラフでDigital Contents Creationにも差がみられるが、これはグラフ73で判る様にOpenCLを使うPhoto EditingやRendering&Visualizationの差で、ここはCUDAコアの数がそのままOpenCLの処理性能に反映されている格好だ。ただこれを除くと大差ない、というのはグラフ74のApplications Scoreを見れば一目瞭然である。
◆TMPGEnc Video Mastering Works 7 V7.0.15.17(グラフ75)
TMPGEnc Video Mastering Works 7 V7.0.15.17
ペガシス
http://tmpgenc.pegasys-inc.com/ja/product/tvmw7.html
最新版のV7.0.16.18でも、特にNVENC周りにUpdateは見当たらないので、今回もV7.0.15.17のまま実施した。結果はグラフ75の通りで、まぁGeForce RTX 3080と大して変わらずである。CUDAコアを使ってのエンコードを行うツールだとまた性能は変わってくるのだろうが。
◆Sandra 20/20 2020.7.30.49(グラフ76~85)
Sandra 20/20 2020.7.30.49
SiSoftware
https://www.sisoftware.co.uk
GeForce GTX 3080のレビューでは取り上げなかったSandraだが、なんでここに入れたかというと、CompuBench 2.0が動かなかったためである。CompuBenchでは起動後にServerと接続を行うのだが、この際にこのエラーが出る(Photo19)。ちなみにこれはDriverを安定版のGeForce Driver 456.55 DCHに切り替えても同じ。
一方で、GeForce RTX 3080は問題なく稼働するので、サーバー側に問題がある訳ではない。で、どうも動きを見ている限り、これはGeForce RTX 3090の問題ではなく、CompuBenchの問題に思える。怪しいのはCUDAコアの数。GeForce RTX 3090では遂に10000の大台を超えた10496個になっているが、プログラムは1万未満しか想定しておらず、ここでコケている気がする(一応メールを送って問い合わせ中だがまだ返事は戻ってきていない)。
とりあえず動かないものは仕方がないのであきらめるとして、代わりにGPGPU的テストを行うものとしてSandraのGPU Testを選んでみた(実はGeForce RTX 3080の際もデータは取っていたのだが、分量の関係で割愛したものである。取っといてよかった)。ちなみにテストはGPGPU関係に限ったほか、DirectX11ベースのテストも省いている。
さてまずは数値演算ということでマンデルブロ図形描画をグラフ76・77に。意外、というかGeForce RTX 3090のスコアがHalf/Single Floatだと妙に伸びない。その一方でDouble/QUad-FloatだとGeForce系列では最速だが、Radeon RX 5700XTには負ける、というちょっと面白い傾向が出てきた。何か、Half-Floatの扱いがうまく行ってない感じである。
もう少し実アプリケーションに近いもの、ということでグラフ78がAES128、グラフ79がAES256のEncryption/Decryptionであるが、これはまぁほぼGeForce RTX 3090の性能が素直に出ている感じである。多少暴れているのがHasing(グラフ80)で、概ね傾向は同じなのだが、SHA-256のCUDAのケースでGeForce RTX 2080 Tiが妙に高い性能を出しているのがその理由である。ただこれを除くとあとはまぁ妥当な結果かと思う。
グラフ81~83はScientific Analysisで、グラフ81はGEMM、グラフ82はFFT、グラフ83はN-Bodyというおなじみのテストであるが、まぁセオリー通りの結果になっている。
最後にMemory Bandwidthの確認である。まず理論帯域であるが、
製品 | メモリ構成 | 理論帯域 |
---|---|---|
GeForce RTX 2080 Super | 15.5Gbps/256bit | 496GB/sec |
GeForce RTX 2080 Ti | 14Gbps/352bit | 616GB/sec |
GeForce RTX 3080 | 19Gbps/320bit | 760GB/sec |
GeForce RTX 3090 | 19.5Gbps/384bit | 936GB/sec |
Radeon RX 5700XT | 14Gbps/256bit | 448GB/sec |
となっており、グラフ84の結果と比較するとどれも大体78~81%ほどの帯域が確保されている格好で、数字的には妥当な範囲と言える。一方Interface Bandwidth、つまりPCI Expressの帯域(グラフ85)であるが、これはもうI/Fの仕様通りという格好で、とりあえずGeForce RTX 3090もちゃんとPCI Express Gen4に対応していることが再確認できた(グラフ6でも一度確認は済んでいるが)