富士通は8月25日、プレス向けに同社のスーパーコンピュータの取り組みについての説明会を開催した。その中で、富士通 次世代テクニカルコンピューティング開発本部長 常務理事 井上 愛一郎氏は、現在、独立行政法人 理化学研究所の依頼を受けて開発中の次世代のスーパーコンピュータで世界一を狙うと述べた。
開発中の次世代のスーパーコンピュータは、10PFLOPS(ペタフロップス)の性能を持ち、2012年の完成を目指している。当初、システム構成はスカラ部とベクトル部の複合システムを目指していたが、今年の5月、ベクトル部を担当していたNECが製造段階からの撤退を表明したため、富士通の進めるスカラ型単独での構成として開発することとなった。
PFLOPS(ペタフロップス)のP(ぺタ)とは単位のことで、M(メガ)、G(ギガ)、T(テラ)の上になる。FLOPSは、1秒間に処理できる浮動小数点計算の数で、1PFLOPSは、1×10の15乗FLOPSになる。
富士通 TCソリューション事業本部 エグゼクティブアーキテクト 奥田基氏によれば、スーパーコンピュータの定義は特にないが、感覚的には10TFLOPS以上のものを指すという。
開発中の10PFLOPSというのは、東京ドームの観客5万人が1秒間に1度計算しても、6400年かかる量だという。
奥田氏は「10PFLOPSになれば、相当世界が変わる。1TFLOPSでは1日かかる解析も、10PFLOPSでは、8.6秒となり、1回しかでいないことが、10回、20回とできる」と語った。
次世代スーパーコンピュータ開発の3つの壁
井上氏は、10PFLOPSの性能を持つスーパーコンピュータには、設置面積、消費電力、故障率という3つの大きな壁があるという。
設置面積では、次世代のスパコンが設置される予定の理化学研究所の神戸センターの延床面積は、約10,500平方メートルだが、現在想定されている10PFLOPS機の設置面積は、その154倍となる約1625,000平方メートルにも及ぶという。
消費電力については、目標の30MW以下に対し、現状は70MW程度が想定されているという。
故障率には関しては、10PFLOPSのスーパーコンピュータの部品点数は膨大な数になるため、現在の技術では数時間1回くらいにどこかの部品が故障することが想定され、故障率をシステム全体として低減される必要があるという。
そして富士通では、これらを克服するための重要な技術をいくつか紹介した。
高性能の実現では、富士通独自開発によるプロセッサのSPARC64の最新版「SPARC64 VIII fx」がまず挙げられる。このプロセッサはCPUコアを従来の1CPU4コアから8コアに拡張したほか、SIMD(Single Instruction Multiple Data)、浮動小数点レジスタの拡張、セクターキャッシュという新規の自社開発技術を搭載している。理論性能は128GFlopsで、現在世界最速のプロセッサとなっている。
「SPARC64 VIII fx」には、SIMD、浮動小数点レジスタの拡張、セクターキャッシュという3つの新規の自社開発技術を搭載 |
SIMDは、1つの命令で複数の演算を並立処理すること。非連続なメモリ空間から1つずつデータを取得し、SIMDで演算可能なことがポイントだという |
レジスタを8倍の256個に拡張したことで、より低速なキャッシュやメモリへのアクセスを減らし、高速化した |
セクターキャッシュは、キャッシュを2分割し、繰り返し利用するデータと一時的なデータで格納するキャッシュを分け、繰り返し利用されるデータがメモリに退避されるのを防ぎ、キャッシュミスを削減する |
また、高信頼性の部分では、CPUのエラー検出・修復機能、低消費電力では、水冷方式を採用する。
CPUのエラー検出・修復機能は、宇宙線の衝突などによりデータが化けるエラーを検出・自動修復技術で、他社CPUがキャッシュに限定されるものを、レジスタや演算器まで広範囲にカバーしているという。
水冷方式については、温度を10度下げれば、部品の寿命が2倍になるほか、本来流れるべきでない部分に電流が流れるリーク電流を削減できるという
なぜ、富士通がスーパーコンピュータ開発に取り組むのかという点について井上氏は、スーパーコンピュータという武器を利用することで、環境や医療分野などでの問題を解決でき、世の中に貢献できる点を挙げ、TOP500 Supercomputer Sitesのようなランキングについては、「何を指標として世界一とするのか。性能だけを出したいのであれば、そういうプロセッサを作ることはできる」と述べ、実用性が伴わないスーパーコンピュータは意味がないとの見解を示した。
また、グリットコンピューティング技術があればスーパーコンピュータは不要なのかという問いに奥田氏は「独立したデータを大量に計算する分野には有効だが、それぞれのデータを連携させることはできない」と述べ、HPCの多くの分野においてはスーパーコンピュータが必要だと語った。