天河1Aのインタコネクトネットワーク

天河1Aのインタコネクトは図12のように、リーフスイッチと、リーフスイッチからの信号をスイッチするルートスイッチからなる2層構造になっている。

16ノードが接続される(第1段の)リーフスイッチボードは、1つのRackに入っている16ノードの間の任意の接続ができるようになっている。

(第2段の)11台のルートスイッチは384ポートで、全体では4224ポートのスイッチを構成している。

第1段のスイッチへの接続は、距離が比較的短いので、電気的なケーブルを使っている。一方、第2段のスイッチへの接続は距離が長いので、光ファイバケーブルを使っている。

  • 天河1A

    図12 天河1Aのインタコネクトネットワークは11台の384ポートSWからなるルートSWと120台のリーフSWで構成されている

天河1Aは140筐体で構成され、その内の112筐体がコンピュート筐体で、ネットワークの通信筐体が6筐体、サービスノードを収容する筐体が6筐体、そして、I/O筐体が14筐体となっている。

天河1AのOS

天河1Aでは、Linux系のKylin Linuxを使っている。そして、使い勝手とセキュリティを改善するため仮想化技術を使った高性能ユーザコンテナ(High Performance User Container:HPUC)を使っている。

HPUCは、サービスノード上で動く仮想コンピュートゾーン、コンピュートノードで動く高性能コンピュートゾーンとHPUCタスクマネジメントという3つの部品で構成されている。仮想コンピュートゾーンは、1つのOSのもとで、複数のユーザが独立の実行環境を動作させられるようにする。そして、タスクマネジメントは仮想コンピュートゾーンとコンピュートノードで動作する高性能コンピュートゾーンを関係づける。

図13で左側に描かれた通常のHPUC(CUC)は自動的に作られて、通常のプログラム開発環境などを作る。ユーザの作る特定のHPUC(SUC)は基本SUCテンプレートを変形して作られ、特定の目的のプログラムを実行する。

天河1Aスパコンでは、管理的な仕事はFT-1000プロセサの上で動かし、実際の高性能な計算処理はコンピュートノードで動かす。これを実現しているのがHPUCである。

  • 天河1A

    図13 HPUCのアーキテクチャ。HPUCのタスクマネジメント、サービスノードで実行される仮想コンピュートゾーン、コンピュートノードで実行される高性能コンピュートゾーンを持つ

(次回は8月27日の掲載予定です)