富士通ブースでのPost-FX10no展示
そして富士通ブースでは、CPU Memoryボードとシャーシが展示されていた。ただし、これはモックアップで本物のチップはほとんどど入ってないとのことであった。それはともかく、CPU Memoryボードには3個のCPUが搭載され、それぞれのCPUに8個のHMCが接続される。そして、この写真の手前側にある合計8個の金属のブロックのように見えるものが光モジュールである。ボードには3個のCPUチップが搭載され、b軸の接続はボード内で閉じるので、外部への引き出しは、X+、X-、Y+、Y-、Z+、Z- 、a、bの8リンクで済む。したがって、1つの光モジュールが1リンクずつを担っているのではないかと思われる。 なお、奥の上面が白い箱はVRM用のインダクタである。
Post-FX10プロトタイプのCPU Memoryボード。3個のSPARC64 CPUチップの両側の黒い8個のチップがHMC。手前の計8個の金属ブロックのように見えるのはTofu 2インタコネクトの光モジュール。奥の11個の上面が白い箱はVRM用のインダクタ |
そして、このCPU Memoryボードを2枚並べて2段に重ねてシャーシに搭載している。
前面側から見るとシャーシは左右対称に見えるので、CPU Memoryボードは左用と右用の2種類があるのかも知れないが、蓋がされている右側のボードは裏向きに搭載されるのかも知れない。
CPUとHMCの部分は銅のコールドプレートで覆われて水冷されており、シャーシの左右に冷却水を接続するノンスピルコネクタが見える。一方、VRMやインダクタの電力ロスはCPUやHMCと比較すると小さく、この部分は伝導冷却のようである。
各CPU Memoryボードの8個の光モジュールから白いケーブルが引き出され、それぞれのボードの前面の8個の光コネクタに接続されている。なお、シャーシの中央の上側に7個のEthernetらしきコネクタが見える。なぜ7個なのかは分からないが管理用のGigabit Ethernetのコネクタではないかと思われる。
京コンピュータやFX10ではキャビネットあたり96ノードであったが、Post-FX10では216ノードとノード数を2.25倍に高めている。また、ノードの演算性能は、京コンピュータが128GFlops、FX10が236.5GFlopsであったのに対して、Post-FX10では1TFlops以上と向上する。結果として、キャビネットあたり200TFlopsを超える性能となり、100PFlopsのスパコンを、京コンピュータより少ない500キャビネット以下で実現できる。このため、富士通ブースには100PFlopsは準備完了と書かれていた。
しかし、この実装密度はGPUアクセラレータを大量搭載するスパコンには敵わない。Top500の上位スパコンにはアクセラレータ搭載のシステムが増えている状況で、CPUのSIMD演算を強化するもののアクセラレータを搭載しないPost-FX10が、実アプリの実行で、アクセラレータ搭載スパコンを上回る性能/コストや、性能/電力を実現できるかが問われる。