ライデン天文台、理研などからなるチームによる銀河系の長期の進化のシミュレーション
銀河は中央に棒状の部分があり、外側が渦巻き状になっている。このような進化や、両者の相互作用や細かい構造がどのように作られているかなど、分からないことが数多くあるという。
これを銀河の誕生からのすべての進化過程をシミュレーションし、ESAの打ち上げたGaia衛星での星の位置や動きの観測値と、シミュレーションで得られた現在の銀河の状態を比較すればより良い理解が得られる。このシミュレーションについてライデン天文台のBedorf氏が発表を行った。
今回の著者にも入っているIshiyamaらがSC12において京コンピュータでのTree Codeの性能を発表しているが、その時は4.45PFlopsであった。今回はより高い性能を得るためにGPUを使用するコードを開発し、TitanとPiz Daintで実行している。その結果、Titanでの実行では、仕事を各GPUに分割する部分は5.38秒から0.15秒と36倍の高速化が達成され、計算を行う部分は35.72秒から4.77秒と12.7倍速くなり、全体での性能は24.773PFlopsと5.57倍となった。
また、右の図の小さいグラフに見られるように、GPU数の大きい部分で若干効率が低下するものの、全体的には良いスケーラビリティーが実現されている。
今回のシミュレーションでは、性能/Wでも2010年のHamadaらの1890MFlops/Wを大きく上回る3030MFlops/Wを達成した。
結論として、世界で最高速のTree Codeを開発し、Titanで18600 GPUを使い24.77PFlopsを達成。これにより、銀河系の全進化過程を7日間でシミュレーションすることができた。
この実装では、すべての計算はGPUで実行し、CPUはロードバランスや通信、非同期IOを実行している。
SC12での石山らのK computerでの結果と今回のTitanでの結果の比較。仕事の分割を行う部分は36倍、繰り返しの部分は12.7倍に高速化し、24,773PFlopを達成 |
GPUあたり13M粒子で、GPU数を横軸に取った性能。小さいグラフは効率(%)。アプリ性能(青線)も良くスケールしている |
MFlop/Wでの過去の結果との比較。2010年の1890MFlops/Wを抜いて、3030MFlops/Wを達成 |
最高速のTree Codeを開発し、Titanで18600 GPUを使い24.77PFlops。銀河系の全進化過程を7日間でシミュレーション。すべての計算はGPU。CPUはロードバランスや通信、非同期IOを実行 |
SC14でのGordon Bell賞はD.E.Shawリサーチが受賞
IBMのTrueNorthやD.E.ShawリサーチのANTON 2のように専用ハードを開発して性能を上げている論文と、その他の論文のように汎用のスパコンを使って計算アルゴリズムなどを工夫して性能を上げている論文を比較することは難しいのではないかと思うが、何らかの基準で比較して、今回はD.E.ShawリサーチのANTON 2がGordon Bell賞に輝いた。
なお、D.E.Shawリサーチは2009年にもANTON 1でSpecial CategoryのGordon Bell賞を受賞している。
今回は、特別賞(Special Category)や奨励賞(Honorable Mention)は無く、D.E.Shawリサーチの本賞獲得だけとなった。