Roadrunnerシステムの諸元を表1にまとめる。CU数は17でノード数は3,060、ピーク演算性能は倍精度浮動小数点演算では1.38PFlops、単精度浮動小数点演算では2.91PFlopsである。そして、1つのCUに含まれるノード数は180で、1つのCUのピーク浮動小数点演算性能は倍精度では80.9TFlops、単精度では171.1TFlopsである。

Tri-bladeの計算ノードはOpteronブレードのプロセサ数は2個、Cellブレード2枚で4プロセサ、Opteronのクロックは1.8GHz、PowerXCell 8iのクロックは3.2GHzである。プロセサに付けられたメモリはOpteronもPowerXCell 8iも4GBである。ただし、Opteronのメモリは667MHz DDR2であるのに対して、PowerXCell 8iのメモリは800MHz DDR2と多少速いメモリである。

また、図5の写真を見ると、Opteronの方はDIMMであるのに対して、PowerXCell 8iの方は18個のメモリチップをQS22ブレードに貼り付けて実装している。

  • Roadrunner

    表1 Roadrunnerシステムの諸元

図9のパイチャートを見ると倍精度の浮動小数点演算の約90%はSPEの演算性能である。そして、メモリはCell側に16GB、Opteron側に16GB付いており、プロセサチップに含まれているメモリはCell側は10.25MB、Opteron側は8.5MBで、DDR2 DRAM以外のメモリはごく少ない。

  • Roadrunner

    図9 左のパイチャートは演算性能がどこにあるのかを示すもので、右のパイチャートはメモリがどこに付けられているかを示すものである

この構成で、Roadrunnerは、2008年5月にLINPACKで1.026PFlopsを記録し、初めてLINPACK計算での1PFlops超えを達成したマシンとなり、Top500の1位となった。Roadrunnerは、2009年11月にオークリッジ国立研究所のJaguarスパコンに超えられるまで連続3期にわたってTop500の1位の座を占めた。