2008年11月14日にTop500のWebサイトにおいて第32回Top500リストが発表された。結果は、前回、1. 042PFlopsでトップに立ったロスアラモス国立研究所(Los Alamos National Laboratories:LANL)のRoadrunnerシステムが、スコアを1.105PFlopsに伸ばして首位の座を守った。一方、ピーク性能では1.64PFlopsとRoadrunnerを上回るオークリッジ国立研究所のJaguarシステムは、1.059PFlopsと前回のRoadrunnerのスコアを超えたが、僅差で2位に甘んじることとなった。

Roadrunnerシステムは、コア数は12万9,600コア、ピーク性能は1.4567PFlopsで、前回の12万2,400コア、1.375776PFlopsに対して、6%弱と小幅な増強が行われている。しかし、これが、首位を守るのには決定的な役割を果たした。

Jaguarシステムは全体では1.64PFlopsのピーク性能であるが、従来の260TFlopsのCRAY XT4システムに、今回、2.3GHzクロックのクワッドコアOpteronを使うXT5システムを増設したという構成になっている。そして、今回のTop500では、この新規増設のピーク性能1.38PFlopsのXT5の部分だけでLinpack 1.059PFlopsを出しており、従来からのXT4システムは、別システムとして8位にランクされている。

そして3位は、今回初登場のNASAのPleiadesシステムである。SGIのAltix ICE 8200のクラスタシステムで、478.01TFlopsを達成している。

第32回TOP500ランキングの上位10台(出典:第32回TOP500リスト)

今回のTop500の発表で特筆すべきは、10位にランクされた上海超級計算センターに設置されたDawning 5000Aシステムである。1.9GHzクロックのクワッドコアOpteronを使い、合計3万720コアでピーク性能は233.47TFlops、Linpack 180.6TFlopsを実現している。このシステムは、設置場所だけでなく、製造会社(曙光信息産業)としても米国以外のシステムとしては最高位である。また、中国システムとしては科学院のDeepComp 7000システムが19位にランクされている。

また、アジアでは13位にインドのTATAのEKAシステム、ヨーロッパでは、11位にドイツのFZJのJUGENE、 14位にフランスのJadeシステムがランクされている。

日本国内のレースでは、東大が27位で国内首位の座を守り、東工大のTSUBAME1.2は77.48TFlopsで29位となった。また、筑波大のT2Kシステムは32位である。

東工大は、従来のTSUBAME1.0システムにXeonによるTSUBASAクラスタとNVIDIAのGPUを使うTesla 10を追加してピーク性能を109.73TFlopsから161.82TFlopsまで引き上げたが、Linpackでは67.7TFlopsから10TFlops弱の増加に留まり、東大のT2Kシステムの82.98TFlopsに及ばなかった。チューニングを担当した東工大の遠藤准教授は、ロードバランスは上手く行っているのだが、通信がネックになったのではないかと述べていた。

Linpackは、行列をLU分解して巨大な連立一次方程式を解くプログラムであるが、多数のノードで並列に効率よく実行できるように高度にチューニングされたプログラムになっている。計算を行うのと並行して次回の計算のデータを送り、通信の時間を計算時間の裏に隠すというプログラム構造になっているのであるが、計算性能が大幅に上がって計算時間が減少すると、通信時間が見えてきて実効性能が下がることになる。東工大のTSUBAMEの場合は、InfiniBandのノード間通信網は当初から使っているものであり、計算ノードの増強に通信性能が追いついていないことはありうることである。