SCC15での各チームのクラスタの諸元
各チームのサーバの諸元をまとめたのが次の表である。
#Node | #Soc/node | Core/SoC | Core/node | Mem/node | Total Cores | Total Mem | |
---|---|---|---|---|---|---|---|
Arizona | 7 | 2 | 12 | 24 | 128 | 168 | 896 |
EAFIT | 10 | 2 | 7@14 3@10 |
7×28 3×20 |
1×193 9×64 |
256 | 768 |
Illinois | 4 | 4 | 16 | 64 | 512 | 256 | 2048 |
North Eastern | 3 | 4 | 16 | 64 | 512 | 192 | 1536 |
台湾清華 | 10 | 2 | 16 | 32 | 128 | 320 | 1280 |
PAWSEY | 9 | 2 | 16 | 32 | 128 | 288 | 1152 |
中国清華 | 8 | 2 | 18 | 36 | 128 | 288 | 1024 |
TU Munchen | 1 | 2 | 14 | 28 | 64 | 28 | 64 |
Oklahoma | 9 | 2 | 12 | 24 | 64 | 216 | 576 |
Accelerator | CPU | Interconnect | Sponsors | |
---|---|---|---|---|
Arizona | 0 | E5-2690v3 | FDR | IT partners、HP、ASU、NAU、UofA |
EAFIT | 0 | 14 E5-2695v3 6 E5-2660v3 |
FDR | Matrix、EAFIT |
Illinois | 0 | E7-8870v3 | 4×EDR | Intel、ANL、IIT |
North Eastern | 0 | Opt-6380 | FDR | AMD、Symmetric Comp.、Northeastern |
台湾清華 | 0 | E5-2698v3 | FDR | NCHPC、Quanta Cloud Tech.、NVIDIA |
PAWSEY | 4 K40 | E5-2698v3 | FDR | Cray、Pawsey Sup Ctr |
中国清華 | 0 | E5-2699v3 | EDR | UNIS |
TU Munchen | 8 Xeon Phi 7120P | E5-2697v3 | EDR | RSC、TUM |
Oklahoma | 0 | E5-2670v3 | FDR 10 | SC、Adaptive、Dell、Intel、OU、Sandisk、Mellanox |
9チーム中、7チームはCPUオンリーのクラスタを使っている。6チームはIntelのXeon CPUを使っているが、ノースイースタン大だけはOpteron CPUを使っている。残る2チームはアクセラレータを装備しており、PAWSEYはNIVDIAのTesla K40を4台、ミュンヘン工大はXeon Phi 7120Pを8台搭載するという構成である。ノード間の接続はすべてInfiniBandであるが、FDRとEDRがある。
今年の課題アプリケーション
今年の課題アプリケーションは、HPLとTRINITY、WRF、MILCとHPC Repastである。HPLはHigh Performance LINPACKで、Top500でのスパコンランキングに使われているアプリである。
TRINITYは、遺伝子シーケンサから出力される短い断片を繋ぎ合わせて元のRNAの構造を作り出すというアプリケーションである。WRFはNCARやNOAAで開発されてきた気象予報や気象シミュレーションのプログラムである。MILCはクオークに働く強い力を計算する量子色力学計算のプログラムである。
HPC Repastは、自律的で相互作用をするエージェントベースのシミュレーションシステムで、株式市場の動きやサプライチェーンの挙動のシミュレーションから、伝染病の広がり方のシミュレーションなどにも使うことができる。今回のSSCでは、HPC Repastを使ってゾンビの侵略の広がりをシミュレーションする。
そして当日に公表されるミステリーアプリケーションがある。今年のミステリーアプリケーションは、係数が疎行列の連立1次方程式をConjugate Gradients法で解くHPCGであった。
HPLと4つの課題アプリケーションは事前に公表されているので、事前に実行環境を整えたり、アプリケーションを自分たちのクラスタ向けにチューニングしたりすることができる。しかし、実行のためのデータは競技の開始時に配布されるので、入力データ依存の動きについては競技中にチューニングを行って性能を改善する必要がある。この場合、単にプログラミングの知識だけではなく、例えばWRFなら気象学、MILCなら色量子力学の知識が役に立つことも多く、情報処理以外の分野の学生をチームに含めることも推奨されている。
ミステリーアプリケーションは、ぶっつけ本番で、当日まで、どのようなアプリケーションであるのかは分からず、準備ができない。このため、チームの実力が試されることになる。しかし、単に実行するだけでなく、そのアプリに対する理解度を試すインタビューもあり、配点が大きいので重要である。
SCC15の総合優勝は中国の清華大学チーム
得点は、これらのアプリケーションの完走、性能とインタビューの評価、チームを説明するポスターの出来などを含めて計算され、電力超過などの減点が行われて、最終得点となる。各チームのスコアは発表されないが、SCC15では、中国の清華大学が総合優勝に輝いた。
そして、LINPACKの最高性能賞は、ミュンヘン工科大学が受賞した。
ミュンヘン工科大学は、1ノードで28コア、64GBメモリとCPUは非常に貧弱であるが、8台のXeon Phi 7120Pを付けるというユニークなアーキテクチャでピークFlopsの高いシステム構成をとったことが高いHPL性能の実現に効いていると考えられる。
日本チームのSCCへの出場は?
今回も、日本からの出場は無かった。Top500にランクインしているスパコンの数では米、中に次いで3位であり、Green500、Graph500では1位と高い技術を誇る日本から、SCCへの出場がないのは残念である。また、若手の育成という点でも懸念がある。
SCC出場には、メンバーをリクルートしてチームを結成するという課題と、費用面でのサポートを行うスポンサーを見つけるという課題がある。日本の状況は、チームが作れないからスポンサーが付かない。スポンサーが見つからないので、チームを作ることができないという鶏と卵の面があるが、この状況が変わりつつある。小企業ながらGreen500などで気を吐いているPEZY Computingの齊藤社長が、日本の大学のSCC出場に意欲を燃やしている。PEZY/ExaScalerがスポンサーになるので、東大と会津大にSCC出場チームの結成を働きかけているとのことである。
日本の大学の学生にとっては、インタビューなどが英語であり、コンピュータの能力に加えて英語の能力も必要と言うハンデがあるが、それは中国や台湾の大学でも同じである。是非、日本チームのSCC出場の実現に漕ぎ着けて戴きたいものである。