次々世代のハイエンドコア「Steamroller」

AMDのBulldozerファミリは、初代のBulldozer、そして、2代目がPiledriverであるが、その次の三代目は「Steamroller」というコードネームが付けられている。AMDのCTOのPapermaster氏は、基調講演の中でこのSteamrollerコアの概要を明らかにした。

Steamrollerコアのハイレベル構成図。このレベルではPiledriverとの違いはMMX Unitが1個になった程度(以降の図は、Hot Chips 24におけるAMDの発表スライドの抜粋)

このブロックレベルの図ではPiledriverコアとの違いはMMX Unitが2個から1個に削減された程度であるが、命令キャッシュのミスを30%低減し、最大数の命令を発行できるケースを25%増やし、分岐予測外れを20%減少し、Piledriverコアに比べてサイクルあたりの平均実行命令数を30%向上するという。

Steamrollerコアでは、Piledriverコアに比べてIPCを30%向上

そして、電力効率の改善としては、命令フェッチの改善やループバッファなどで命令フェッチ部のダイナミック電力を減らし、浮動小数点ユニットでは、利用頻度の低いMMX Unitを1個削減する。さらに、仕事が少なくヒマな時には2コアで共用するL2キャッシュの使用部分を縮小して電力を削減する。

Steamrollerコアの性能/w性能の改善

また、Papermaster CTOは、プロセサノード間をつなぐFreedom Fabricについて触れた。このインタコネクトはAtomベースの高密度サーバを開発していたSeaMicroが開発したもので、256ノードを3次元トーラス状に接続し、各CPUから見ると、このFabricの入り口はPCI Expressに見え、Fabricにつながれた通信アダプタやディスクコントローラを共有できるというものであった。

数百か数千のCPUノードをリンクするFreedom Fabricテクノロジ

AMDはこのようなサーバビジネスに参入する気は無いということは買収発表の直後から表明されていたが、このFabricをAMDがどのように使うのかは明確な情報が無かった。

今回のPapermaster氏の講演では、AMDはFabricのスケーラビリティを改善して数1000ノードまで接続できるようにして、仮想IOで数100台のマルチTBのストレージを共有するという使い方を示した。また、FabricをCPUと同じチップに集積するのではないかという見方もされていたが、このスライドではFabricは別チップという感じである。

■Hot Chips 24関連記事
【レポート】Hot Chips 24 - 次世代コアを並べて発表し、存在感を示したAMD(3) (2012年9月26日)
【レポート】Hot Chips 24 - 次世代コアを並べて発表し、存在感を示したAMD(2) (2012年9月25日)
【レポート】Hot Chips 24 - 次世代コアを並べて発表し、存在感を示したAMD(1) (2012年9月24日)
【レポート】Hot Chips 24 - 学会初登場のIntelのメニーコア「Xeon Phi」(後編) (2012年9月19日)
【レポート】Hot Chips 24 - 学会初登場のIntelのメニーコア「Xeon Phi」(前編) (2012年9月18日)
【レポート】Hot Chips 24 - 乾いたタオルを絞るIvy Bridgeの省電力技術 (2012年9月7日)
【レポート】先端プロセサの発表が盛りだくさん - Hot Chips 24が開幕 (2012年8月28日)