2010年11月14日にWeb公開された第36回Top500で、中国の国防科学技術大学(NUDT)の天河一号A(Tianhe-1A)が2.566PFlopsを達成して第1位となり、11月16日のBoF(Bird of Feathers:同じ羽の鳥は集まるから転じて、同好の士の集まり)で表彰式が行われた。普通のBoFは小さな会議室で行われるものが多いが、Top500 BoFは、さすがに周囲の席はがら空きであったが基調講演と同じ2000人以上は収容できそうなオーディトリアムで開催され、別格であった。

2010年6月のランキングでトップと2位であった米国オークリッジ国立研究所のJaguarと中国の星雲(Nebulae)は2位と3位に後退し、第4位に東京工業大学(東工大)のTSUBAME2.0が入るという結果となった。

また、興味深いのは、115位にBlue Gene/Q、170位に日本の京コンピュータがランクインしていることである。これらは、部分的な小規模システムの結果であるが、その実力をうかがい知る手がかりになる情報が含まれている。

表1:第36回Top500のトップ10システムとBG/Q、京コンピュータ

この表から分かるように、トップ10システムの内訳は、1位と3位が中国で、米国は2位を筆頭に5システム、日本は4位、フランスが6位、ドイツが9位となっている。また、11位から30位のところの大半は米国が占めているが、そこにはロシア、韓国(3システム)、ドイツ(2システム)、イギリス、フランス、ブラジルの名前が見える。

東工大が4位に入ったので日本としての面目を保ったと言えるが、その次の日本のシステムはJAEA(日本原子力研究開発機構)の33位であり、中国には完全に抜かれているし、ヨーロッパの英、独、仏に比べてもやや弱体、韓国にも追いつかれてきているという感じがする。1990年台の黄金時代の再現は望むべくもないが、科学技術で高齢化の進む国民を養って行こうとするなら、GDPランクに見合う程度のスパコンの設置、利用は必要と思うのであるが、心もとない限りである。

中国の天河一号Aシステム

今回、中国の天河一号Aシステムは2.566PFlopsを達成し、米国のJaguarを抜いてトップになった。これまで中国は米国の研究機関などに出向している人が代理で授賞式に出席していたが、さすがに今回はトップであるので、本当の関係者が出席した。

Top500の主催者の1人であるハンス・モイヤー教授が関係者の名前を読み上げたのであるが、ドイツ訛りの英語で中国人の名前を読まれると、まったく分からない。ICレコーダで録音したのを、数回、聞きなおしたのであるが、やはり分からないので、失礼ながら単に関係者とさせていただく。

受賞スピーチをする天河一号Aの関係者。右はハンス・モイヤー教授

天河一号Aは、昨年11月のTop500で5位となった天河一号のアップグレードという感じの命名であるが、実は、中身は大きく異なっている。昨年のシステムでは、CPUはIntel製の4コアのNehalem-EP、GPUはAMDのRadeon、インタコネクトは×4 DDRのInfiniBandであったが、今回のシステムは、CPUは6コアのWestmere-EP、GPUはNVIDIAのM2050、そして独自インタコネクトと主要コンポーネントはすべて入れ替わり、次の2枚の写真のように筐体の外観も違っている。ということでアップグレードとはいっても、いわゆるフォークリフトアップグレードである。

天河一号

天河一号A

表1のコンピュータの項を見ると、2.93GHzクロックの6コアX5670(IntelのWestmere-EP)とNVIDIA GPU、そして8コアのFT-1000という名前が見える。Top500の発表ではこれだけであるが、中国国内のスパコンをランキングするTop100にはもう少し詳しい情報が載っており、それによると、X5670を14,336個、NVIDIAのM2050を7,168個、1GHzクロック、8コアのFT-1000プロセサを2048個使用するシステムとなっている。

天河一号Aのピーク性能は4.701PFlops、総コア数は18368コア(中国Top100では202,752コア)となっている。計算をしてみると6コアのX5670が14,336個と14コア(Streaming Multiprocessorを1コアと数える)のM2050が7,168個で18,368コアになる。また、ピーク性能も4.7PFlopsとなり、LINPACKの計測はX5670とM2050で行われ、FT-1000は使われていないようである。

Top500の18,368コアに8コアのFT-1000プロセサを2,048個加えると中国Top100の202,752コアとなり、計算は合っている。Top500の発表を見る限りFT-1000のシステムはLINPACKの計測には使われていないと考えられるが、中国としては国産CPUであるFT-1000が天河一号Aに使われているということをアピールしたかったのだと思われる。

このFT-1000(飛騰)プロセサであるが、1GHzクロック、8コアということは、2010年8月のHot Chipsで発表されたGodson-3Bプロセサの仕様と一致するのであるが、ICTの関係者に聞いたところでは、違うとのことであった。

そして、今回のシステムのもう1つの大きな特徴が独自開発の80Gbps(双方向の合計は160Gbps)のインタコネクトの採用である。この性能はQDR ×4のInfiniBandの2倍のバンド幅である。このインタコネクトの詳細は発表されていないが、独自開発のインタコネクトチップであるという。