AMDは、6月29日に開発コードネーム"Polaris"(ポラリス)で知られる、新GPU「Radeon RX 480」を発売するとともに、その派生モデルとなる「Radeon RX 470」と、エントリーGPUの「Radeon RX 460」の詳細について発表した。
【ベンチマークテストの結果はこちら】 Radeon RX 480ファーストインプレッション - 期待の"Polaris"、そのパフォーマンスを探る |
---|
Radeon RX 480は、GLOBAL FOUNDRIESの14nm FinFETプロセスを採用したGPUで、36Coumpute Units(CU)を統合することで、2,304基のストリームプロセッサを搭載。TSMCの28nmプロセスを採用した従来のRadeon R9 290に比べて、CUあたりのパフォーマンスは15%向上したと言う。
またAMDは、Radeon RX 400シリーズとして、Radeon RX 480と同じ"Polaris 10"を使用するRadeon RX 470と、"Polaris 11"を採用するRadeon RX 460を順次市場投入する意向を示す。現段階で公開されている主な仕様は下記のとおり。
Radeon RX 400シリーズの基本仕様 | |||
製品名 | Radeon RX 480 | Radeon RX 470 | Radeon RX 460 |
---|---|---|---|
開発コード名 | Polaris 10 | Polaris 11 | |
GPUアーキテクチャ | 第4世代GCN | ||
製造プロセス | GLOBAL FOUNDRIES 14nm FinFET | ||
ダイサイズ | 234平方mm | 124平方mm | |
Compute Unite(CU)数 | 36 | 32 | 14 |
ストリーミングプロセッサ数 | 2,304 | 2,048 | 896 |
浮動小数点演算性能 | 5TFLOPS以上 | 4TFLOPS以上 | 2TFLOPS以上 |
メモリサイズ | 4/8GB | 4GB | 2GB |
メモリインターフェース | 256bit GDDR5 | 128bit GDDR5 | |
最大消費電力 | 150W | 110W | 75W |
補助電源コネクタ | 6ピン×1 | - | |
HDMI | 2.0b | ||
DisplayPort | 1.3 HBR3 / 1.4 HDR対応 |
そのアーキテクチャには、Radeon R9 Furyシリーズの第3世代GCN(Graphics Core Next 1.2)から進化した、第4世代GCNを採用。メモリ圧縮技術のアップデートやジオメトリ処理性能の向上などを果たしている。
Radeon RX 480のCompute Unit(CU)は、16基のストリーミングプロセッサを1 SIMDベクタユニットとし、これを4組、計64基のストリーミングプロセッサを統合。さらに、スカラ演算ユニットと4基のテクスチャフィルタリングユニット、16基のロード・ストア/テクスチャフェッチ&フィルタリングユニットが組み合わされる。
各SIMDベクタユニットは、それぞれ65KBのレジスタを備え、スカラ演算ユニットには4KBのレジスタ、64KBのローカルデータ共有メモリ、16KBのL1データキャッシュが搭載される。つまり、基本構成は当初のGCNから変更はない。
Radeon RX 480では、このCUを9基ごとにジオメトリプロセッサとラスタライザ、レンダーバックエンドを組み合わせたシェーダーエンジンを構成する。そしてグラフィックス処理の命令発行をつかさどる1基のグラフィックス・コマンド・プロセッサと、コンピューティング処理を担う4基のACE(Asynchronous Compute Engine)がGPUを制御する。
第4世代GCNで何が変わったのか
第4世代GCNの強化ポイントとしては、
- ジオメトリエンジンの強化
- シェーダー処理効率の向上
- メモリコントローラの改良とデータ圧縮技術の拡張
- L2キャッシュの倍増
- 非同期コンピューティングの強化
が挙げられる。
ジオメトリエンジンの強化では、描画する必要のないオブジェクトのトライアングル処理をより積極的に省略することで、テッセレーション性能を向上させたほか、小さなインスタンシングデータのためのインデックスキャッシュを追加し、ストリーミングエンジン内のデータ移動を最小限に抑え、ジオメトリ処理の効率を高める。
シェーダー処理効率では、命令プリフェッチや命令バッファサイズの強化により、シングルスレッド性能を引き上げた。加えて、第3世代GCNアーキテクチャを採用したAPUですでにサポートされていたFP16およびINT16処理を、GPU単体でもサポートできるようにしている。
また、Polaris世代では、メモリコントローラと物理層を一新し、最大8GbpsのGDDR5メモリのサポートを可能とするとともに、2分の1、4分の1、8分の1レシオによるデルタカラー圧縮をサポートし、メモリアクセスを最小限に抑えることで、256bitインタフェースでも効率的なメモリアクセス性能を実現している。L2キャッシュを従来の倍となる2MBとすることで、メモリトランザクションを最大40%低減できるとしている。
AMDがGCNアーキテクチャのウリにしている、非同期コンピューティング(Asynchronous Computing)に関しても強化が図られている。第4世代GCNでは、2基のハードウェアスケジューラを搭載しており、VRにおけるタイムワープ処理などの最優先処理をより動的に処理できるようにしている。
AMDでGPUアーキテクチャの開発を指揮するMike Mantor氏(Senior Fellow)によれば、「ハードウェアスケジューラそのものは、実は第3世代GCNから実装していたが、本格的な活用はPolaris世代からになる」と説明するように、グラフィックスと汎用コンピューティング処理の動的な割り当てなどを可能にしているようだ。
出力インタフェースやビデオアクセラレーションも大幅な強化
一方、ディスプレイ対応や、ビデオアクセラレーションも大幅な強化が図られた。Polaris世代では、ハイダイナミック(HDR)表示に対応したDisplayPort 1.3 HBR3および1.4 HDRに対応し、4K/96Hzの10ビット表示に対応した。
DisplayPort 1.3のサポートによって、シングルケーブルで5K60出力も可能になる。このデモシステムではRealtekのDP 1.3レシーバのエンジニアリングサンプルを利用(箱の中に隠されていた) |
また、HDMIについても2.0b対応となり、4K60HzのHDR表示もサポートされることになった。ビデオアクセラレーション機能では、1080p/240Hzまたは4K/60HzのHEVCエンコード機能をサポートするとともに、2パスエンコードのサポートにより、高品質な映像表現を可能にしている。
【ベンチマークテストの結果はこちら】 Radeon RX 480ファーストインプレッション - 期待の"Polaris"、そのパフォーマンスを探る |
---|