既報のとおり、2017年8月14日(米国時間)に、米国航空宇宙局(NASA)は国際宇宙ステーション(ISS)に向けて、ヒューレット パッカード エンタープライズ(HPE)がカタログに掲載している「HPE Apollo 40シリーズ」を2台組み合わせたスーパーコンピュータ(スパコン)「Spaceborne Computer」を打ち上げ、運用を続けてきた

その運用期間は1年間の予定で、運用終了後、2018年11月に実施が予定されているSpaceX CRS-16のドラゴン補給船にて地上に戻され、さまざまな評価・検証が進められる見通しだ。運用開始から約10か月を経た現在、果たして「Spaceborne Computer」はどうなったのか。HPE(旧SGI)のVice President,HPC&AIのChief Technology Officer(CTO)であり、同プロジェクトを指揮するDr. Eng Lim Goh氏に話を聞いた。

  • Dr. Eng Lim Goh

    HPE(旧SGI)のVice President,HPC&AIのChief Technology Officer(CTO)であり、Spaceborne Computerプロジェクトの主任研究員であるDr. Eng Lim Goh氏

宇宙放射線の影響はどうなった?

3月に同氏に話を聞いた際は、細かなL3キャッシュエラーが複数インシデントとして発生した(訂正可能なエラー)ほか、1台の電源系に異常が、そして総数20台のSSDのうち、4台に障がいが発生したとのことであったが、そこからさらに数か月を経ても、2台のSSDに追加で異常を検出した以外、CPU、メモリといったサーバそのものは安定して稼動を続けているという。

Nasa is putting a supercomputer into orbit so we can eventually get to mars

ISSの軌道は、低地球軌道(LEO)と呼ばれる地上高度400kmほどの地球周回軌道だが、太陽系外から飛来する銀河宇宙線、太陽フレア放射線、放射線帯粒子といった宇宙放射線の影響を受ける可能性が地上よりも高い。こうした宇宙放射線は、「トータルドーズ効果(TID)」、「 はじき出し損傷効果(DDD)」、「シングルイベント効果(SEE)」などの影響を半導体素子に引き起こすことが知られているが、約10か月の間、2台のサーバがそうした影響を表面的に出さずに、かつエラー発生率も地上における発生頻度とほぼ変わらず、安定して稼動してきたことについて、NASAでも興味深い話題として取り上げられているという。

  • Spaceborne Computerのイメージ

    Spaceborne Computerのイメージ (資料提供:HPE)

「ここまでの約10か月ほどの運用で見えてきたことは、サーバを宇宙仕様に変更しないで、民生品の状態で宇宙に送り込んだ場合、電源が重要になることが分かった。今回の研究でも冗長性を持たせていたが、結論から言えば、3重冗長にする必要があると思っている。SSDについても、検証が必要だと思っている。リブート後に復旧を確認していることから、コントローラ側の問題がある可能性もあるが、地上にサーバが戻ってきた後、SSDの製造元とともに、HPE側の障がいなのか、SSD側の障がいなのかをともに調査したいと思っている」(同)と、現時点で分かっているハード的な課題を説明する一方、「ソフトウェアをスマート化することで、負荷を見つつ、システムが停止する前に、自律的に処理を分散できるようにしたことが、ここまで安定して稼動し続けてきた理由の1つだと思っている」(同)と、ソフトウェアの進化が安定稼動に寄与している可能性を示唆した。

  • ISSとSpaceborne Computer取り付けの様子

    ISSとSpaceborne Computer取り付けの様子 (資料提供:HPE)

地上帰還後、どのような評価・検証を行なうのか

では、地上に戻ってきたSpaceborne Computerは、具体的にどのような評価・検証が行なわれるのか。「まずは診断ソフトを使って、さまざまなデータの抽出を1~2か月かけて実施。その後、ハードウェアプローブを活用して、6か月ほどかけて詳細な評価を行なっていく計画」(同)とするが、ハードウェアの検証については、ソフトウェア関連の評価を終えた段階で、必要かどうかの判断も含めて検討するとしている。ただし、「SSDのコントローラに関する検証と、PCIeバスの検証は重要だと思っている。SSDのエラーが、コントローラなのか、スロットなのか、原因をはっきりとさせる必要がある。そのためには、戻ってきた実物をまずは見てみて、どのようなことになっているかを物理的に確認することが重要になる」(同)と、ハードウェアの評価・検証も重要かつ必要なものであることに変わりはないとする。

ちなみに、ドラゴン補給船から回収され、NASAの検査を受けてからHPEへの引渡し、ということとなるので、「検証結果を踏まえて、ある程度、その結果を話せるようになるのは、ソフトウェアによる検証を終える2019年夏ごろ以降」(同)とのことであり、そうした評価結果を踏まえ、同社でも、次のステージを考えて行きたいとする。また、「NASAが考えている方向性に寄り添った形でHPEとしても検討を進めていきたい」(同)と、あくまでNASAが主体で、HPEは、それを支える立場であることを強調する。

宇宙開発にスパコンが活用される可能性

とはいえ、Spaceborne Computerは民生品のHPE Apollo 40シリーズをベースに電源系をISSに接続できるようにしただけのものだ。逆に言えば、世界的に宇宙開発競争が激しくなってきている現在、より高度なコンピューティング処理を衛星や探査機に行なわせたい、という考えからHPE Apollo 40シリーズを、宇宙で試してみたい、というニーズがNASA以外から出てくる可能性だってある。

そうした点について同氏に聞いてみたところ、「日本の宇宙航空研究開発機構(JAXA)や欧州宇宙機関(ESA)など、NASAと協力関係にある機関からの要請であれば、まずNASAに製品化して提供が可能かを確認したうえで、さまざまな法規制に照らし合わせ、問題がないかの検討を行ったうえでの判断になると思う。ただ、彼らとNASAは仲がよいので、直接NASAに使いたい、という連絡を入れるかもしれない」と、いろいろと解決すべき点はあるとしながらも、「宇宙のコンピュータといえばHPE製、と言われるようになるのは、我々の目指すところでもある」としており、NASAと足並みを揃えながら、宇宙でのコンピューティング活用を目指していきたいとする。