東京大学(東大)および国立天文台(NAOJ)は、共同開発し国立天文台三鷹キャンパスに設置されたスーパーコンピュータシステム「GRAPE-DR」が電力あたりの性能のランク付けを行うGreen500プロジェクトが発表した2010年6月の「Little Green 500 List」で1位にリストされ、世界トップの電力あたり性能を実現していることが認定されたことを発表した。

GRAPE-DRシステム

GRAPE-DRは、HPLベンチマークで1Wあたり815MFlopsの処理性能を実現。これは、現在世界最高速のオークリッジ国立研究所(ORNL)のスパコン「Cray XT6システム」の約3倍の電力あたり性能を達成したこととなる。

測定に使ったシステムは、 GRAPE-DRシステム全体のうち64ノードで、 1ノードはGRAPE-DRボード1枚、Intel製CPU「Core i7-920」、 ASUS製マザーボード、18GBのDDR3メモリ、×4 DDRインフィニバンドネットワークからなるもので、東大およびNOAJで開発したGRAPE-DRボード以外は一般市販部品を用いて実現された。

GRAPE-DRプロセッサボード

また、GRAPE-DRボードを利用せず、Core i7のみを用いた場合、HPLベンチマークでの性能は2.2TFlopsとなり、消費電力あたりの性能は150MFlops/W程度となる。 GRAPE-DRボードを使うことで、同じ台数のシステムで性能を10倍以上の23.4TFlopsまで向上させ、電力あたり性能をも5倍以上の815MFlops/Wへと引き上げることを実現した。

今回の要素技術は、以下の4つ。

  1. 低消費電力を実現する1チップ超並列プロセッサ「GRAPE-DRプロセッサチップ」を開発。チップ単体で、200GFlopsの性能を50Wの消費電力で実現
  2. GRAPE-DRプロセッサ4チップを搭載し、ホスト計算機と高速・低レイテンシで通信できるGRAPE-DRプロセッサボードを開発
  3. HPLベンチマークのコアである行列演算で、理論ピークの80%程度と高い効率を実現した
  4. HPLベンチマークに対して、アクセラレータ向けの新しいアルゴリズムを使うなどの最適化を施し、性能を向上させた

GRAPE-DRプロセッサチップ

すでにGPGPUなどのアクセラレータを利用したシステムでのHPLベンチマーク結果は、いくつか発表されているが、GPGPU自体の絶対性能や電力あたり性能が低いこともあり、ホスト計算機単体性能の2倍程度の性能向上しか実現できず、電力あたり性能もそれほど改善されたとは言えなかった。

研究チームでは、GRAPE-DRには性能向上の余地がまだあり、2010年度中にさらに50%程度の電力あたり性能向上を目指すほか、より大規模なシステムの性能測定を行う計画としている。