AMDは、6月29日に開発コードネーム"Polaris"(ポラリス)で知られる、新GPU「Radeon RX 480」を発売するとともに、その派生モデルとなる「Radeon RX 470」と、エントリーGPUの「Radeon RX 460」の詳細について発表した。

【ベンチマークテストの結果はこちら】
Radeon RX 480ファーストインプレッション - 期待の"Polaris"、そのパフォーマンスを探る

Radeon Technologies Groupを率いるRaja Koduri氏がRadeon RX 480の製品戦略を説明

Radeon RX 480は、GLOBAL FOUNDRIESの14nm FinFETプロセスを採用したGPUで、36Coumpute Units(CU)を統合することで、2,304基のストリームプロセッサを搭載。TSMCの28nmプロセスを採用した従来のRadeon R9 290に比べて、CUあたりのパフォーマンスは15%向上したと言う。

Radeon RX 480のリファレンスカード

Polarisファミリーでは、Radeon RX 480と同470のベースとなる"Polaris 10"と、Radeon RX 460のベースとなる"Polaris 11"の2つのダイが用意される

またAMDは、Radeon RX 400シリーズとして、Radeon RX 480と同じ"Polaris 10"を使用するRadeon RX 470と、"Polaris 11"を採用するRadeon RX 460を順次市場投入する意向を示す。現段階で公開されている主な仕様は下記のとおり。

Radeon RX 400シリーズの基本仕様
製品名 Radeon RX 480 Radeon RX 470 Radeon RX 460
開発コード名 Polaris 10 Polaris 11
GPUアーキテクチャ 第4世代GCN
製造プロセス GLOBAL FOUNDRIES 14nm FinFET
ダイサイズ 234平方mm 124平方mm
Compute Unite(CU)数 36 32 14
ストリーミングプロセッサ数 2,304 2,048 896
浮動小数点演算性能 5TFLOPS以上 4TFLOPS以上 2TFLOPS以上
メモリサイズ 4/8GB 4GB 2GB
メモリインターフェース 256bit GDDR5 128bit GDDR5
最大消費電力 150W 110W 75W
補助電源コネクタ 6ピン×1 -
HDMI 2.0b
DisplayPort 1.3 HBR3 / 1.4 HDR対応

Polaris11こと、Radeon RX 460のブロックダイヤグラム

Radeon RX 460は、ダイサイズを大幅に縮小しただけでなく、モバイルPCなどで求められる薄型パッケージも実現

そのアーキテクチャには、Radeon R9 Furyシリーズの第3世代GCN(Graphics Core Next 1.2)から進化した、第4世代GCNを採用。メモリ圧縮技術のアップデートやジオメトリ処理性能の向上などを果たしている。

Polarisのアーキテクチャ詳細について説明するMike Mantor氏

Radeon RX 480のCompute Unit(CU)は、16基のストリーミングプロセッサを1 SIMDベクタユニットとし、これを4組、計64基のストリーミングプロセッサを統合。さらに、スカラ演算ユニットと4基のテクスチャフィルタリングユニット、16基のロード・ストア/テクスチャフェッチ&フィルタリングユニットが組み合わされる。

Polaris10こと、Radeon RX 480のブロックダイヤグラム

各SIMDベクタユニットは、それぞれ65KBのレジスタを備え、スカラ演算ユニットには4KBのレジスタ、64KBのローカルデータ共有メモリ、16KBのL1データキャッシュが搭載される。つまり、基本構成は当初のGCNから変更はない。

Radeon RX 480では、このCUを9基ごとにジオメトリプロセッサとラスタライザ、レンダーバックエンドを組み合わせたシェーダーエンジンを構成する。そしてグラフィックス処理の命令発行をつかさどる1基のグラフィックス・コマンド・プロセッサと、コンピューティング処理を担う4基のACE(Asynchronous Compute Engine)がGPUを制御する。

第4世代GCNで何が変わったのか

第4世代GCNの強化ポイントとしては、

  • ジオメトリエンジンの強化
  • シェーダー処理効率の向上
  • メモリコントローラの改良とデータ圧縮技術の拡張
  • L2キャッシュの倍増
  • 非同期コンピューティングの強化

が挙げられる。

GCN(Graphics Core Next)アーキテクチャの変遷

ジオメトリエンジンの強化では、描画する必要のないオブジェクトのトライアングル処理をより積極的に省略することで、テッセレーション性能を向上させたほか、小さなインスタンシングデータのためのインデックスキャッシュを追加し、ストリーミングエンジン内のデータ移動を最小限に抑え、ジオメトリ処理の効率を高める。

ジオメトリエンジンの強化ポイント

シェーダー処理効率では、命令プリフェッチや命令バッファサイズの強化により、シングルスレッド性能を引き上げた。加えて、第3世代GCNアーキテクチャを採用したAPUですでにサポートされていたFP16およびINT16処理を、GPU単体でもサポートできるようにしている。

CUもスレッドあたりの処理性能を向上

また、Polaris世代では、メモリコントローラと物理層を一新し、最大8GbpsのGDDR5メモリのサポートを可能とするとともに、2分の1、4分の1、8分の1レシオによるデルタカラー圧縮をサポートし、メモリアクセスを最小限に抑えることで、256bitインタフェースでも効率的なメモリアクセス性能を実現している。L2キャッシュを従来の倍となる2MBとすることで、メモリトランザクションを最大40%低減できるとしている。

L2キャッシュサイズを倍増することで、メモリトランザクションを最大40%削減するとともに、電力効率向上にも役立てている

AMDがGCNアーキテクチャのウリにしている、非同期コンピューティング(Asynchronous Computing)に関しても強化が図られている。第4世代GCNでは、2基のハードウェアスケジューラを搭載しており、VRにおけるタイムワープ処理などの最優先処理をより動的に処理できるようにしている。

ハードウェアスケジューラの搭載により、より柔軟かつ動的な演算処理の振り分けを可能にしている

AMDでGPUアーキテクチャの開発を指揮するMike Mantor氏(Senior Fellow)によれば、「ハードウェアスケジューラそのものは、実は第3世代GCNから実装していたが、本格的な活用はPolaris世代からになる」と説明するように、グラフィックスと汎用コンピューティング処理の動的な割り当てなどを可能にしているようだ。

出力インタフェースやビデオアクセラレーションも大幅な強化

一方、ディスプレイ対応や、ビデオアクセラレーションも大幅な強化が図られた。Polaris世代では、ハイダイナミック(HDR)表示に対応したDisplayPort 1.3 HBR3および1.4 HDRに対応し、4K/96Hzの10ビット表示に対応した。

Radeon RX 400シリーズでは、DisplayPort 1.3 HBR3および1.4 HDRに対応するとともに、HDMI 2.0bにも対応する

Display Port 1.3では、シングルケーブルで5K60Hz表示も可能になる

DisplayPort 1.3のサポートによって、シングルケーブルで5K60出力も可能になる。このデモシステムではRealtekのDP 1.3レシーバのエンジニアリングサンプルを利用(箱の中に隠されていた)

Display Port 1.3の対応解像度

また、HDMIについても2.0b対応となり、4K60HzのHDR表示もサポートされることになった。ビデオアクセラレーション機能では、1080p/240Hzまたは4K/60HzのHEVCエンコード機能をサポートするとともに、2パスエンコードのサポートにより、高品質な映像表現を可能にしている。

Radeon RX 400シリーズでは、10bitまたは12bitのHDR表示をフルサポート

Radeon RX 400シリーズでは、4K60にも対応したHEVCエンコード機能が追加された

より高品質なHEVCエンコードを実現すべく、2パスエンコードをサポートする

左側が1パスエンコード、右側が2パスエンコード

デコード機能も強化

ビデオ機能の強化により、プレミアムコンテンツの対応も万全

【ベンチマークテストの結果はこちら】
Radeon RX 480ファーストインプレッション - 期待の"Polaris"、そのパフォーマンスを探る