Graphics Memory - GDDR5X搭載製品が少ないわけ

Photo25:Photo18に比べると仲がよさそうだが、良く見るとまめっちがすごく緊張してる

前回も紹介した通り、GDDR5は8Gbpsまで達したものの、さすがにこのあたりで打ち止めであり、これに代わるものとしてGDDR5Xが標準化されたが、いまのところ採用例はNVIDIA一社に留まっている。ちなみに前回の説明では一個所間違いがあった。それはPrefetchの長さで、前回は8n Prefetch×4と書いたが実際は16n Prefetch×2だった。

それはさておき、そのGDDR5Xがなぜ普及しないかといえば、1つはベンダーが少ないから。いまのところGDDR5Xを量産しているのはMicronだけで、Samsung/SK Hynixは公式にはラインナップにGDDR5Xが載せられていない。両社ともGDDR5Xはスキップして、次のGDDR6を目指しているのと、DDR5X世代ではHBM2を積極的に推進しているのがその理由と思われる。

もう1つは、速度が上がったことで設計が非常に難しくなったことだ。実際GDDR5Xを採用するGeForce GTX 1080の場合、当初はReference(NVIDIA用語で言うところのFounder Edition)しかなかったのは、ベンダー各社とも独自設計を進めていたものの、タイミングがクリティカルすぎて動かないという話が続出、ボードの再設計を余儀なくされていたかららしい。

ボードメーカーからすると、チップの値段はMicronの単独供給なので下がりにくいし、動作周波数も16Gbpsまで行かず最大でも14Gbpsどまりなので「それならHBM方面でいいや」ということになりやすい。

またGDDR5Xは原理上、消費電力は下がらない(転送速度/消費電力という観点ではGDDR5と一緒)ので、このあたりでもメリットは感じられなかったのだろう。結局PascalベースのGeForce GTX 1080とGeForce Titan XのみがGDDR5Xを利用するに留まっている。

では2017年は? というと、投入予定なのはAMDのVegaとNVIDIAのVoltaであるが、AMDはいまのところGDDR5Xには否定的だし、VoltaはそもそもHBM2などの積層メモリを使うのが特徴とされていたから、メインはHBM2ということであろう。ただVoltaの世代でも一部にGDDR5Xが残る可能性は否定できない。

Graphics Memory - GDDR6の動向

さて、GDDR5Xの次であるGDDR6とはどんなものか? という話だが、2016年のHotChips 28のTutorial Sessionで概略が紹介されている(Photo26)。まずノイズに起因する問題を避けるため、クロストークを抑えやすいパッケージを使うと共に、3B4Bないし8B9Bのエンコードを施す(=その分信号線の数を増やす)方式が有力視されている(Photo27)。

Photo26:Samsungの推定では2018年にDDR5/GDDR6/LPDDR5が出揃うとしているが、これは製品の投入時期そのものではないと思う。ちなみに出典は"The future of graphic and mobile memory for new applications"(JIN KIM, Samsung Electronics)

Photo27:クロストークは信号同士の相互干渉であり、これを抑えるために信号線の数を増やすことで対応するというもの。何と言うか、昔のEIDEのケーブルみたいな話になっている

また波形の乱れを補正するためのDFE(Decision Feedback Equalization)を導入することになりそうだ(Photo28)。ちなみにGDDR5XではWCKの4倍速でDQを駆動する方式だったが、GDDR6ではもう少し無難に新しくCAを導入し、WCKはCAの倍速、DQはWCKの倍速という方式を取るとする(Photo29)。

Photo28:これを入れるのはもちろんGPUの側である

Photo29:GDDR5Xの場合、WCKの4倍速のClockをGDDR5Xのチップ内で生成し、この生成したClockでDQの駆動を行う形になっていたのがちょっと危うかったが、GDDR6では安定性重視という感じだ

これらの機構の導入により、安定かつ安価にGDDR5の倍の速度で転送が可能になる、としている。先のPhoto26にもあるように、GDDR6ではPower Efficiencyも改善する(おそらく信号電圧を更に下げると思われる)ので、このあたりもGDDR5Xよりもメリットであり、諸々の高速伝達に向けた新機能の導入でGDDR5Xよりもっと楽に16Gbpsの伝達が可能になるとみられている。GDDR5Xではこうした配慮はなく、単純に信号速度を倍にしたので非常にクリティカルになったが、GDDR6ではこのあたりが大幅に改善されそうだ。

Graphics Memory - HBM2はラインナップ拡充、そしてHBM3

最後がHBMの話。HBM1に続くHBM2は、NVIDIAが採用しており、今後もHBM2がより広く使われていくと思われる。明言はされていないが、AMDのVegaもHBM2を採用する模様だ。そのHBM2、SKHynixは8Hi/4Hi/2Hiのラインナップで、合計9種類のHBMを提供することを明らかにしている(Photo30)。

Photo30:同じくHotChips 28における、SK HynixのKevin Tran氏による"The Era of High Bandwidth Memory"より抜粋。とりあえずGPU向けは2Hiの構成になるだろう

いずれもバス幅は1024bitだが、1/1.6/2GHzの3種類のSpeed Skewがあるとしており、これならばハイエンドだけでなくミドルレンジでも相対的に安価なHBM2チップを使えることになる。こうした形でラインナップを広げ、普及にはずみをつけたいと考えているようだ。

さてこれに続くものとしてHBM3がある。残念ながらスライドはないのだが、2016年のIDFでSamsungが語った内容をベースにすると、 * Stackをより高く(8H以上。16まで行くかどうかは不明) * 転送速度を2倍以上(最大4Gbps以上) * 電圧をより低く(現在は1.2V)

といった点が違いとなる。後の特徴は現在のHBM2を継承し、正常進化である。一方SK HynixはHBM3世代で、より幅広い機能を追加することを考慮しているようだ(Photo31)。

Photo31:ECCが無い訳ではなく、Samsungが2016年から製造を開始した4GBのHBM2にはECCが搭載されていることがプレスリリースで明記されている

これとは別に、Samsungはより低価格なHBMの提案も行っており(Photo32)、HBM3の世代ではこのあたりもオプションとして標準化されるかもしれない。ただ現状、このHBM3がいつごろ標準化が完了するのかははっきりしない。ただHBM2が広く普及する2018年ごろまでには何らかの仕様は策定されることになるだろうと思われる。

Photo32:TSVの数を減らすことで低価格化が可能だが、そのまま帯域がせまくなるので、その分信号速度を引き上げるという形