世界トップクラスを狙うTSUBAME2.0
姫野氏に続いて、TSUBAMEシステムでGPUコンピューティングをいち早くスーパーコンピュータに取り入れた実績を持つ東京工業大学(東工大)の学術国際情報センター 教授である青木尊之氏が「GPUスパコンの今後の展開:TSUBAME 2.0」と題して講演を行った。
すでにTSUBAMEシステムでは、2008年にGPUコンピューティングとしてNVIDIA Tesla S1070を170台(680カード)導入し、TSUBAME1.2へとバージョンアップが図られている。
青木氏は、HPCアプリケーションにおけるGPUの利用方法としては、「今あるプログラムをいかにGPUに載せるかが問題。1から書き換える(FULL GPU計算)のはかなりの苦労が伴うため、場合によっては1部を置き換えようという発想での活用方法(一部GPU計算)もある」とするが、一部GPU計算は、PCI ExpressでCPUのメモリとGPUのメモリがデータ交換を行うため、そこの転送レートがボトルネックとなることから、流体計算などには向かないとしながらも、それでもある程度のアプリで数10%~3倍程度の加速率を出せるとする。一方のFULL GPU計算の場合、GPUカード上のメモリのみで演算を行うので、加速率は10~100倍程度に向上することを利点として挙げる。
また、主なGPUコンピューティング適用アプリケーションとしては、重力多体問題や分子動力学計算といったメモリアクセスに対して計算負荷が高い粒子計算の分野が始めに適用され、2番目にメモリアクセスが多いFFTへと適用が進み、最近では、メモリアクセスに対して計算負荷が低く、アクセスが飛び飛びになるような、メモリアクセスが計算を支配する格子計算などでも成功例が報告され始めているとし、適用分野が広がってきているという。
さらに、マルチGPU環境での演算については、各ノード間の転送レートが演算速度に比べ遅いため、GPU側で一部分の演算を先に行い、メモリを非同期状態として通信を実施しながら残った演算を行い、転送される先のGPUもデータをコピーしながら演算を行うことで、「通信を隠蔽することで、ピーク性能に対して16GPU程度までならリニアに性能が向上していく」(青木氏)とする。ただし、「30GPUくらいになると、非同期通信のため、割り込み命令が発生するなどの影響により遅くなってしまう」(同)とする。
TSUBAMEで実証した演算結果として青木氏は、「16GPUで、1CPU当たりの演算の1000倍の演算性能となるが、1000CPUで演算しても16GPUの演算性能には届かない結果となっており、HPCの大規模アプリケーションとしてGPUの有効性が実証された」とし、結論として、「計算時間と通信時間のバランスが取れていると早く、通信が長くなるのであれば、いかにそれを隠蔽するのかがポイントとなる。もしGPUを多く使用するのであれば、逆に隠蔽しないほうが良いケースも出てくる」(同)と、ノード間のインターコネクションの性能に注意する必要があるとした。
こうした知見を踏まえて、TSUBAME2.0は2009年8月31日に最終仕様が確定されたという。それによると、「GPUに依存するところが大きいが、世界一クラスの性能を目標とした」(同)という。具体的には、単精度演算で6PFLOPS、倍精度で3PFLOPSをターゲットとしており、CPU単体でも300TFLOPSを実現する構成で2010年7月に導入される予定である。ただし、「どういったGPUを入れるかなどの詳細については未定。現行のTeslaでは倍精度演算が弱いので、そういった部分の改良などをGPUメーカーに進めていってもらいたい」(同)と、性能を実現できるGPUの登場を期待するとしている。また、東工大の中に設置されるため、消費電力の問題も気にしないといけないが、「大学側から多少の余裕はもらったが、それでも厳しいことには変わりはない。この目標性能はGPUの電力効率が高いからこそ大学でもできる値」(同)とする。
なお、世界一になれるかどうかは、世界のほかのスパコンの動向次第であるためその時にならないと判断できないが、「少なくとも世界一クラスに位置づけられる性能」(同)になるわけであり、実際に目標性能を達成して稼働すると、現在日本に設置されているスパコンすべての性能を結集しても追いつかない性能を1大学が保有することとなる。
そのため、東工大ではTSUBAMEの共同利用を2009年7月28日より開始しており、「学術利用」「産業利用」「社会貢献利用」の3区分で、それぞれ一口10万円(2880ノード時間=64CPUコアで約1カ月相当の計算時間)から提供している。青木氏は、「有償となってしまうが、GPUを沢山使ってみたいという研究や、ちょっとだけ試しに使ってみたいという場合でも引き受ける」としており、複数GPUを試してみる良い機会なので、是非興味がある人/企業/団体などは利用してみてもらいたいとした。