最近とある国立大学の情報基盤センターによるスパコンの紹介プレゼンを見る機会があった。
高額な設置初期費用と運用費用がかかるスパコンについては、何時ぞやの国会予算審議で野党議員から「2位じゃダメなんですか?」などの質問が出るくらい、費用対効果が厳しく精査される時代になった。今回のプレゼンを見て、現在の日本のスパコン事情が大きく変わってきたことを実感した。かつてのスパコンとそれを取り巻く環境は、どちらかと言うとアカデミア界にありがちな中央集権的で閉鎖的な印象があったが、今や日本のスパコンはますます進化し、民主化されてきている。
計算力の開放で社会インフラのさらなるイノベーションに積極的にかかわる姿勢
水、燃料、電力など社会インフラを支える原資となるものの中で、「計算力」の需要がますます高まってきている。急速にデジタル化する現代社会において、コンピューターによる計算力は「いくらあっても足りないもの」となっている。
人々の日々の生活から国家安全保障に至るまで、高度にデジタル化された社会インフラの裏では膨大な計算がなされ、その結果として生み出される膨大なデータが保存されている。その計算力の提供者の頂点に立ってきたのがスーパーコンピューター(スパコン)である。かつてのスパコンのユーザーは気象、流体力学、素材設計、医学・創薬、構造設計などの開発現場でのシミュレーション用途が多く、その母体は大学を含む政府系研究機関や大企業の研究所などが主だったが、現在ではそのユーザーベースは過去には考えられなかった幅広い分野に広がっている。
クラウドベースの幾多のサービスが人々の日常生活に入り込んだ現在では、自動運転や物流、検索サービス、暗号化など、ビッグデータを扱う全ての分野でより多くの計算力が求められている。こうした状況を踏まえて計算力の提供者としてのスパコン環境も大きく変化してきている。冒頭の某国立大学のスパコンの紹介用プレゼンでは下記のような点が目立った。
- ユーザーベースを拡大すべく、対象ユーザーの間口を広く取っている。特にデータサイエンスやAI基盤の提供による新サービスの提供を前面に出している。
- 日本最高峰の理化学研究所の「富岳」との連携ができように、ソフトの整合性をとっている。また、市販のGPUクラスター部分を充実させ、高い計算力を効率よくしかも安価に提供しようとしている。
- ユーザーである研究機関や民間機関が高い計算力を必要とする時に、スムースに計算力を提供できるように、利用計画書の提出などの審査を大きく簡略化し、成果の報告書や論文出版などの義務事項も省略している。
- スパコン利用の課金体系は前払い定額制のプリペイド形式で、「利用ノード数×利用時間」でどれくらいのポイントを消費するかが一目でわかる料金表が明確に提示されている。その申し込み・予約はWebブラウザ―で簡単にできる。
- 初めてのユーザーへのサービスとして「お試し利用」が可能で、その性能や使い勝手を実体験できる。
複数ユーザーが共同で使用できるグループ利用の「新サービス」のキャンペーンなども実施していて、まるで民間のデータセンター業者のサービスと見紛うほどの変貌ぶりで、かつては敷居が高かったスパコンの進化と民主化が強く感じられた。
「みんなのスパコン」を前面に打ち出した東工大のスパコン“TSUBAME”
このプレゼンを目にして思い出したのが、東京工業大学(東工大)が2006年に運用を開始した「TSUBAME 1.0(初代TSUBAME)」である。その後も世代交代し進化を続けているTSUBAMEの初代機TSUBAME 1.0は、80TFLOPSの性能で、日本国内では最速、その年の世界のTop500で堂々7位に輝いた。
TSUBAME 1.0の構成は、AMDのCPUデュアルコアOpteronベースのサンマイクロシステムズのサーバー655ノードと、ClearSpeed社のアクセラレーターボードの組み合わせというもので、AMDのCPUベースのスパコンとしてはTop500の10位以内に入った世界初のものだった。当時、このプロジェクトをAMDで担当していた私は総責任者の東工大の松岡教授とは何度もお会いして、スパコンについてのビジョンを伺う機会に恵まれた。この辺の事情は以前にコラムにまとめたので詳細は記事を参照されたい。
1990年の中ごろからクラスター型計算機の研究を開始して、最初の大規模クラスターとなるTSUBAMEの構想を練っていた2000年初頭には、すでに松岡氏は現在のようなビッグデータが社会インフラとなる環境をはっきり予見していて、その環境におけるスパコンの要件を下記のように語っていた。
- 実証実験から広い分野の研究者にユーザーとして使ってもらうことで、高速計算を提供する実用機としての知見を蓄積することが重要。
- スパコンに求められるのは単なるベンチマークでの絶対性能だけではなく、広範囲の実アプリケーションでの高速処理能力である。しかも運用にかかる電力コストも考慮した省電力性能も重要な条件となる。
- 膨大な初期投資をできるだけ抑えるために、できる限り民生用のパーツを使用する。
- その対象となる計算分野はそれまでのシミュレーションだけではなく、AIやビッグデータ解析などを研究する「データ科学」の分野を積極的に取り込む。
TSUBAMEの発表に際して松岡氏は「みんなのスパコン」、という当時としてはかなり奇抜なキャッチフレーズを用意していた。これらの松岡氏のビジョンは今日の日本のスパコン事情に見事に反映されていて、今回の某国立大学のスパコンのプレゼンではこれらがすべて実装されている印象が残った。現在のスパコンの進化と民主化は松岡氏のビジョンの具現化と言っても過言ではないと思う。
現在、松岡氏は昨年までTop500で世界1位のポジションにあった理化学研究所のスパコン「富岳」のセンター長として活躍されている
膨大なビッグデータ解析での高速計算需要が今後のスパコン技術発展を牽引する
高いスループットを実現するためにCPUによるスカラー演算とGPUによるベクトル演算を組み合わせたハイブリッドなアーキテクチャーは、今日のスパコンにすっかり定着した感がある。
特にAIを駆使したビッグデータ解析の加速化のために、次々と新たなアプローチが登場してきている。最近、特にAIや深層学習などの分野でカギとなる並列計算を加速するデータフロー型の超並列計算に特化した半導体チップやサブシステムの発表が相次いでいる。こうしたデータフロー型のコンピューターの考え方はかなり昔からあったが、半導体チップとして集積されるような時代が来るとは以前には想像できなかった。半導体微細加工の驚異的な発展がこれを可能とした。これからのスパコンはこうした新技術の動静を見極めながら、多様化するユーザーの要求をどう満たしてゆくかに応えてゆくことが重要な要件となる。
果たして、松岡氏は現在どのような構想をお持ちなのか伺ってみたいものである。