GPUとXeonクラスタの追加で日本一奪還を目指す東工大TSUBAMEシステム

TSUBAME1.0は、655台のSun MicrosystemsのX4600サーバをInfiniBandで接続したスパコンである。X4600は2.4GHzクロックのデュアルコアOpteronを8ソケット搭載するサーバで、これにClearSpeedの浮動小数点演算アクセラレータが追加されている。このClearSpeedアクセラレータは、クロックは210MHzとあまり速くはないが、1チップに96演算コアを集積しており毎サイクル384演算を実行することができる。ということで、システム全体では、Opteron部分の倍精度浮動小数点演算能力は50.3TFlops、ClearSpeed部分の演算能力は29TFlopsであり、全体として約80TFlopsのピーク演算能力を持っている。

これに対して、TSUBMA1.2では、NVIDIAのGPUボード「Tesla 10」を680枚追加する。また、TSUBAME1.2では、TSUBASAとco-TSUMBAMEというそれぞれ90ノードのXeonブレードサーバクラスタが増設され、全体構成は図のようになる。

TSUBAME1.2システムの構成(赤字で書かれた部分が、追加される部分)>

提供:東工大GSICセンター

TSUBASAシステムと呼ぶXeonクラスタは、8ソケットのクワッドコアXeonブレード90枚からなるシステムで、8.2TFlopsの倍精度浮動小数点演算性能を持ってる。このTSUBASAは、5台の24ポートIBスイッチ経由でTSUBAMEのバックボーンに接続されている。

90ブレード TSUBASAシステムの構成

そして、TSUBAMEに増設される「Tesla S1070」のGPU自体は、同社の最新のグラッフィクスボードに使用さているGTX 280と基本的には同じものであるが、コアの動作クロックはGTX 280が1,296MHzであるのに対して、Tesla 10では1.44GHzに引き上げられている。従って、クロック周波数に比例してチップあたりの単精度浮動小数点演算性能は1TFlopsを超え、倍精度浮動小数点演算性能は86.4GFlopsとなっている。

しかし、消費電力を抑えるためか、メモリクロックはGTX 280が1,107MHzであるのに対して800MHzにダウンしており、メモリバンド幅は102GB/sとなっている。もちろん、102GB/sでもNehalem-EPの4倍であり、メモリ容量に制約はあるものの、Xeonに比べるとぶっちぎりのバンド幅である。

そして、Tesla S1070は、4枚のGPUボードを1Uのスリムな筐体に収容し、2本のPCI-Express　2.0 x16でホストサーバに接続する構成となっている。ただし、TSUBAMEの場合は、2年前に設置したX4600がPCI-Express 1.0のx8インタフェースしか持っておらず、S1070との間のバンド幅をフルに利用することはできない。

「Tesla S1070」(左下と右上付近にある銅色のものがGPUのヒートシンクである。左上と右下の黒い部分は裏向きのGPUボードのGPU取り付け部分)

提供:東工大GSICセンター

この写真に見られる大型のヒートシンクが付いたのがGPUであり、2枚ずつ裏表に搭載されている。ペアとなるGPUボードを裏向きで180度回転して搭載しているので、両方のボードの同じ信号ピンが同じ位置になるという上手い実装である。そして、このペアのボードを1チャネルのPCI-Express 2.0に接続していると思われる。

Tesla S1070は、筐体は1Uとスリムであるが、消費電力は700Wとかなりのものであり、それだけを纏めてロッカーに詰め込むと放熱が問題となる。また、ホストサーバとなるX4600に接続する必要があるので、S1070だけを独立の筐体に詰め込むのではなく、X4600を収容するロッカーのX4600の隙間に実装している。

TSUBAME1.0を止められず、この増設はシステムが稼働中に実施したとのことで、担当した某N社のフィールドエンジニアは相当苦労をしたようである。


(左)X4600の隙間に1UのS1070を挿入している様子(右)Teslaのロゴ(写真では判別困難である)を指差す松岡聡教授提供:東工大GSICセンター

GPUとXeonクラスタの追加で日本一奪還を目指す東工大TSUBAMEシステム

目次

AIが勧める、あなたのための会員限定記事

広島県が取り組むAI活用に迫る第3回高校生がAI人材になれるよう支援する「ひろしまAI部」とは

Dirac Audioを搭載したPCで不具合、Windows 11バージョン24H2の提供一時停止

軍事とIT 第589回システムの統合化(23)米海軍に見る複合戦指揮官コンセプトと指揮統制システム

サイフューズとSCREEN、細胞製品の品質評価を効率化する新技術を開発

筑波大と三井不動産、次世代サイエンスパーク実現に向け産学連携協定を締結

Samsungが半導体事業の本拠地を平澤に移転か？　韓国メディア報道

編集部が選ぶ関連記事

スパコン「TOP500」発表 - ペタFLOPS時代に突入、地球シミュレータは49位に

Samsungが半導体事業の本拠地を平澤に移転か？　韓国メディア報道

AMDがGPUクラウドを提供するスタートアップのVultrに出資

メルクが静岡事業所に半導体パターニング材料の研究開発センターの新設を計画、投資額は約100億円

米商務省、CHIPS法に基づいた最大4億5800万ドルの補助金をSK hynixに支給

三菱ケミカル、半導体向け高純度合成石英粉の生産能力増強を決定

日総工産と熊本県立技術短大、半導体人材の育成に関する連携協定を締結

このカテゴリーについて

GPUとXeonクラスタの追加で日本一奪還を目指す東工大TSUBAMEシステム

目次

AIが勧める、あなたのための会員限定記事

広島県が取り組むAI活用に迫る 第3回 高校生がAI人材になれるよう支援する「ひろしまAI部」とは

Dirac Audioを搭載したPCで不具合、Windows 11バージョン24H2の提供一時停止

軍事とIT 第589回 システムの統合化(23)米海軍に見る複合戦指揮官コンセプトと指揮統制システム

サイフューズとSCREEN、細胞製品の品質評価を効率化する新技術を開発

筑波大と三井不動産、次世代サイエンスパーク実現に向け産学連携協定を締結

Samsungが半導体事業の本拠地を平澤に移転か？ 韓国メディア報道

編集部が選ぶ関連記事

スパコン「TOP500」発表 - ペタFLOPS時代に突入、地球シミュレータは49位に

Samsungが半導体事業の本拠地を平澤に移転か？ 韓国メディア報道

AMDがGPUクラウドを提供するスタートアップのVultrに出資

メルクが静岡事業所に半導体パターニング材料の研究開発センターの新設を計画、投資額は約100億円

米商務省、CHIPS法に基づいた最大4億5800万ドルの補助金をSK hynixに支給

三菱ケミカル、半導体向け高純度合成石英粉の生産能力増強を決定

日総工産と熊本県立技術短大、半導体人材の育成に関する連携協定を締結

このカテゴリーについて

広島県が取り組むAI活用に迫る第3回高校生がAI人材になれるよう支援する「ひろしまAI部」とは

軍事とIT 第589回システムの統合化(23)米海軍に見る複合戦指揮官コンセプトと指揮統制システム

Samsungが半導体事業の本拠地を平澤に移転か？　韓国メディア報道

Samsungが半導体事業の本拠地を平澤に移転か？　韓国メディア報道