Seymour Cray賞を受賞したWallach氏のConvey

Conveyという名称であるが、Wallach氏がかつて創立したミニスーパーコンピュータメーカーのConvexから、最後の一字がxからyに変わっただけという社名である。

Conveyの製品「HC-1」は、ハードは2枚のボードからなり、1枚はデュアルソケットの普通の2.13GHzクロックのXeonのマザーボードであるが、もう1枚はConveyが開発したロジックの載ったコプロセサボードである。この2枚のボードが上下に配置されており、写真では、下側のXeonマザーボードは見えない。

ConveyのHC-1のコプロセサボード(左)とベクトルプロセサの構成図(右)

Conveyのボードは、XilinxのFPGA「Vertex-5」4個で任意のロジックを実現でき、それらのFPGAからメモリコントローラチップを介して2バンクのDRAMに接続されている。

写真で中央付近に横方向に4個並んでいるのがこれらのFPGAである。そして、手前と奥の方の四隅にDIMMがあり、その中央寄りに計8個のLSIがあるが、これがDIMM2枚ごとのメモリコントローラである。

そして中央付近にある2個のLSIが、Xeonマザーボードとの接続やキャッシュコヒーレンシを制御するLSIである。このConveyのコプロセサボードがユニークなのは、Xeonの一方のソケットに接続され、Xeonとメインメモリをキャッシュコヒーレントにシェアすることが出来る点である。

FGPAのアクセラレータ製品は他社からも出ているが、Conveyの製品の特徴は、これらのプロセサをFPGA上に作れるというだけでなく、これらの専用プロセサの機能を使う機械命令を出すコンパイラを提供する点である。

したがって、ユーザはFPGAで実現された機能を特別に意識したプログラミングを行う必要はなく、通常のCやFORTRANでプログラムを記述することができる。しかし、性能的には人手でチューニングを行う場合に比べてロスがあると思うが、どの程度の性能が得られるかは発表されていない。

また、現状でFPGA上に実現されているのは単精度浮動小数点演算のベクトルプロセサである。右側の写真のように、各FPGAに8本の演算パイプを収容し、全体では、1サイクルあたり320単精度浮動小数点演算を実行することができる。

また、1サイクルに32の8バイト幅のロード/ストアを実行できる。クロックを質問すると3nsとのことであり、全体で100GFlops程度のピーク性能である。特別のプログラミングが必要ないというのはメリットであるが、この性能では1TFlops級の性能を持つGPUに比べるとかなり見劣りするという感じがする。

Conveyは他の用途向けのプロセサ実装についても開発を行っており、カリフォルニア大学のサンディエゴ校と共同開発しているタンパク質計算用プロセサは、すでにβ版ができているという。また、その後、金融や気象などの分野向けのプロセサも開発する予定である。

Violin MemoryとFusion-IOのSSD

ネットブックやノートパソコンでフラッシュメモリを使うSSD(Solid State Disk)が注目を集めているが、スパコンやハイエンドサーバの分野でも高いIOPS(I/O per Second)性能を得る目的でSSDが登場してきている。

左はViolin MemoryのSSDである。4KBブロックのRandom Writeで100K IOPS、Readでは400K IOPSという。モジュールの容量は64GBであり、この筐体に4TBを収容できる。また、右側はFusion-IOのSSDで、128GBのSLCのモジュールは、同じく4KBブロックのRandom Read/Writeとも約100K IOPSである。

Violin Memory(左)とFusion-IO(右)の高IOPS SSD

サウジアラビアからも出展

King Abdullah University of Science and Technology(KAUST)はアラブでは珍しい男女共学で、理科系の能力が高い人間は男でも女でも関係ないという思想で運営される。

そして、米欧から破格の待遇で優秀な教授陣を集めており、来年9月に開校の予定である。そして、最先端の研究、教育を行うために、スパコンもBlueGene/Pで222TFlopsと強力なマシンを導入する。