次世代スパコンが世界一である必要があるのか?

筆者は、次世代スパコンがTop500で世界一を獲得することはあまり重要でないと思う。スパコン関係者の間でも、Top500のトップをとることはBragging Right(自慢する権利)で、それ以上ではないという意味で捉えられていると思う。しかし、仮に、同時期のTop500の1位マシンが16PFlopsだとすると、日本の次世代スパコンは、LINPACKでその半分以上は出せ、その他の各種の実アプリケーションではトップのマシンと同程度という世界でトップクラスのマシンであるべきだと思う。

1つひとつのプロセサコアの性能が頭打ちになり、スパコンは否応なく超並列になってきている。いわゆる"Amdahlの法則"で、並列化して処理できる部分は並列度を増すことにより処理時間を短縮できるが、並列化できない部分の処理時間は短縮されず、全体性能のネックとなる。現在の10倍の並列度のマシンで効率よく動くプログラムを開発しようとすれば、現在のマシン上の実行時間で5~10%くらいを占める並列化できない部分を見つけ出して対策を打たなければならない。これが100倍の並列度のマシン用のプログラムを開発するとなると、全体の実行時間の1%以下のオーダーの並列化できない部分をすべて見つけ出して対策を行う必要がある。つまり、使用しているマシンの10倍程度の並列度を持つマシンのプログラムは、注意深くやれば開発できるが、100倍の並列度を持つマシンのプログラムの開発は非常に難しい。やはり、トップクラスに位置付けていないと、周回遅れのランナーになってしまう。

なお、長崎大学のGPUクラスタが158TFlopsと、Top500では国内トップの海洋開発研究機構のスパコンのLINPACK性能を上回りGordon Bell賞を獲得したことから、このような作り方をすればもっと安くできるのではないかという指摘がある。

長崎大のやったN体問題やLINPACKはGPUで性能を出しやすい問題であるが、科学技術計算にはGPUでは性能が出ない問題も沢山存在するので、この指摘は妥当ではない。また、補足すると、長崎大の158TFlopsはGPU向きに最適化した演算量の多い計算方法によるものであり、汎用プロセサでは同じ計算が57.3TFlopsで実行できるという。

10PFlopsの1システムが良いのか1PFlopsの10システムが良いか

2009年12月1日付けの毎日新聞によれば、仕分け人の1人である東大情報基盤センターの金田教授は、「10PFlopsのマシン1台を作るより1PFlopsのマシンを作れば同じ費用で10台以上作れ、より多くの研究者に使わせることができ、その方が日本の科学技術を底上げできる」と述べている。これは、1つの見識である。

スパコンといっても、現在のスパコンでは時間がかかりすぎて出来ないような計算ができるCapability(能力)をもつセンターと、多くの研究者にそこそこの計算性能を提供するCapacity(容量)のセンターの両方が必要であり、米国では、両方の拠点を並行して整備している。

両方を整備するだけのお金が無い場合にどちらを優先すべきかは、人それぞれ見解が分かれると思うが、筆者はCapabilityマシンを作るべきであると思う。東大の情報基盤センターでもそうであるが、大型スパコンでも、全体を1つの計算で占有することは稀であり、通常は、分割して複数の仕事を実行している。ちょうど、大きなホテルのホールが全体を1つの巨大な部屋として使うことも出来るが、パーティションで仕切って、複数の部屋として分割して使用することも出来るようになっているようなものである。スパコンでも、小規模マシン10台よりも、大規模マシンを必要に応じて区切って分割使用するほうが色々な利用形態にマッチすると思う。

同じ費用で1PFlopsのマシンを作れば10台以上作れるという金田教授の指摘は、マシンのハードウェアだけを見ると正しい指摘であるが、それらの1PFlopsマシンを別個に設置するとなれば、建屋や受電設備、管理や運営を行うスタッフのコストなどが増加することを考えると、両者でそれほど大きなコスト差があるとは思われない。また、現在、日本のトップクラスのスパコンセンターは50~100TFlopsのシステムを持っており、次世代スパコンが実運用に入る2013年ころには0.5~1PFlops程度のCapacityを持つセンターが5~10程度出来ると考えられる。日本全体を見れば、これらのセンターをCapacityスパコンとして使用し、10PFlopsの次世代スパコンはCapabilityシステムとして運用するのが妥当であると思う。

また、NECや日立製作所が計画から撤退しており、計画を見直すべきという指摘がある。どのようなスパコンを作るのが良いかについては、千差万別の意見があるので、そのような指摘が出るのは避けられない。しかし、スパコンの世界は年率2倍のペースで性能が向上しており、見直しで開発が1年遅れると、次世代スパコンはTop10に入れるかどうかも怪しくなり、開発成果を使う富士通の商用スパコンの競争力も大きく減損してしまう。ここがダムなどの建設とは大きく異なる点で、スパコンの1年遅れは致命的で、これまで投入した500億円は無駄になってしまうし、メーカーの意欲も削がれてしまう。