チップ上の4つのグループは同じ構造で、NoCネットワークで接続されている。Compute Nodeは4つのグループを含み、全体として4個のMPE、4個のCPE(MPEとCPEの合計で260コア)と4個のメモリコントローラと(MC)とネットワークコントローラからなり、MCは8GBのDDR3メモリをアクセスできるようになっている。

図2にSW26010チップのパッケージ写真を示す。

  • SW26010チップのパッケージ写真

    図2 SW26010チップのパッケージ写真。MPEが4コアとCPEが256コアで、全体として260コアを集積している

TaihuLightスパコンはシステム全体では40,960ノードを持ち、合計10,649,600個のコアと1.31PBのメモリを持っている。計算処理は主にCPEが実行するが、MPEも計算処理を実行することができる。

CPEは8Flop/cycleで64bit浮動小数演算を実行できるパイプラインを1本備えている。クロック周波数は1.45GHzであるので、CPEは8Flops×1.45GHz=11.6GHzの倍精度浮動小数点演算を実行できる。

MPEは16Flops/Cycleの演算パイプラインを備えているので、CPEの2倍の23.2GFlopsの演算を行うことができる。

TaihuLightシステムの1つのノードは、CPEが256core×8flops/cycle×1.45GHzで11.8784Tflops、MPE部は(4core×16flops/cycle×1.45GHzで合計3.0624Tflopsの演算性能を持つ。全システムでは、40,960ノードを持っているので125.4Pflopsの演算性能を持つことになる。

(次回は10月21日の掲載予定です)