富士通はSC14に合わせて新スパコン「PRIMEHPC FX100」を発表した。中身は、これまでPost FX10と呼んでいたものを、FX100という商品名にしたというだけであるが、製品発表に伴い、SC14でのベンダーフォーラムではより詳しい情報が発表された。

SC14でPRIMEHPC FX100について発表する富士通の清水俊幸氏

富士通は2011年6月と11月に京コンピュータでTop500の1位を取り、2011年11月にプロセサコア数を倍増した商用版のFX10を発売した。今回のPRIMEHPC FX100は、FX10の後継となる機種である。

富士通はFX100の提供開始時期を発表していないが、第1ユーザである日本原子力研究開発機構(JAEA)への2014年末の納入が間に合わず、契約解除されたという報道がなされている。第2ユーザと見られている宇宙航空研究開発機構(JAXA)のJSS2「宙(SORA)」スパコンは、2015年4月から1PFlops分を運用開始の予定であり、これが実質的な提供開始になるのではないかとみられる。SC14の富士通の展示ブースで、新庄本部長に「JAXAは大丈夫ですか?」と聞いたら、「行けるでしょう」という答えであった。

富士通のスパコンのロードマップ

FX100に使われている「SPARC64 XIfx(11fx)」プロセサは、FX10の「SPARC64 IXfx(9fx)」プロセサの16コアから32コアとコア数を倍増し、各コアのSIMD演算の幅を256bitと倍増している。これにより1サイクルに実行できる倍精度浮動小数点演算数は2倍となり、コアあたり16演算/サイクル、チップあたりでは512演算/サイクルとなった。

今回の発表ではクロック周波数は明示されていないが、8月のHot Chipsでの発表では2.2GHzとなっており、512×2.2=1.1264TFlopsとなる。なお、これまでの富士通のプロセサは単精度浮動小数点演算の場合でも倍精度と同じ数の演算しかできなかったが、スパコンでも単精度でも良い計算もある程度存在することから、SPARC64 XIfxでは、Intelのプロセサと同様に、単精度の場合は2倍の演算ができるようになった。

富士通はSPARC64 XIfxプロセサチップのサイズは公表していないが、SC14で展示されたウェハのチップ搭載数から計算すると680mm2程度と思われる。前世代のSPARC64 IXfx(9fx)は482mm2であったので、チップは、かなり大きくなっている。

演算性能はFX10から4倍強に増加したが、メモリとしてHMC(Hybrid Memory Cube)を採用し、Read、Writeともに240GB/sのメモリバンド幅を得ており、0.4~0.5Byte/Flopのメモリバンド幅と演算性能のバランスを維持している。

ノード間を繋ぐTofu2インタコネクトは12.5GB/sとFX10の時の5GB/sから2.5倍のバンド幅に高速化されたが、4倍あまりのFlopsの伸びには追い付いていない。しかし、集合通信のレーテンシの短縮やハードウェアバリアのサポートなどの機能強化が行われているという。そして、FX10までの初代Tofuではすべて銅線のケーブルを使っていたが、Tofu2では高速化に伴い、シャーシ間の接続は光ファイバに変わっている。

また、FX100ではメモリも水冷化し、全体の90%の熱を水冷で運び出している。

京(K)、FX10、FX100の3世代のプロセサチップの比較。演算性能は128GFlopsから1+TFlopsと8倍あまり向上

32コアとFX10からコア数倍増に加えて、2個のアシスタントコアを追加。SIMD幅も256bitに倍増

20nmプロセスを採用し、3.75Bトランジスタを集積で、Tofu2インタフェースを内蔵化。MicronのHMCを採用

Tofu2インタコネクトは光ファイバでシャーシ間を接続。水冷率も90%に向上