日本オラクルはこのほど、「Oracle Cloud Infrastructure HPC」および「Oracle Observability and Management Platform」に関する説明会を開催した。

最近、クラウドサービスとして高性能コンピューティング(HPC)やGPUを利用する傾向が高まっており、主要なクラウドプロバイダーは関連サービスを提供している。そうした中、オラクルのHPCサービスはどんな強みを持っているのだろうか。

テクノロジー事業戦略統括 ビジネス推進本部 シニアマネージャー 近藤暁太氏は、「製造、金融、ライフサイエンス、オイル&ガス、気象、メディア、ゲームなど、さまざまな業界でHPCやGPUのクラウド活用が進んでいると説明した。

  • 日本オラクル テクノロジー事業戦略統括 ビジネス推進本部 シニアマネージャー 近藤暁太氏

なぜなら、HPCはクラウドに適しているからだという。その理由について、近藤氏は「クラウドサービスは使いたいだけ使うことができる。したがって、納期前に大量のリソースを使い、使い終わったら課金を止められる。加えて、最新のテクノロジーを使うことができる」と語った。

つまり、HPCをクラウドで利用することで、製品開発の時間の短縮やコストの削減を実現できるとともに、用途に応じて最適なテクノロジーを必要な時に利用することができるというわけだ。HPC関連の最新テクノロジーを自社でそろえるのはそう簡単なことではない。

  • HPCをクラウドで利用するメリット

オラクルのHPCの歴史をひもとくと、2010年に買収したサン・マイクロシステムズの人材が開発に関わっているという。2016年にはベアメタル・サーバを導入したが、「これが、われわれのHPCのパフォーマンスのよさに響いている」と近藤氏は話した。

HPC向けのOracle Cloud Infrastructureは、HPC向けの低遅延ネットワークとベアメタル・サーバーより、オンプレミスのInfiniBand HPCクラスタ同等以上の性能を実現しているという。近藤氏は、Amazon Web ServicesやGoogle Cloudと同社のネットワークの遅延を比較するベンチマークの結果を示し、同社の優位性をアピールした。

  • HPCサービスにおけるネットワークとベアメタルのパフォーマンスのベンチマークの結果

「Oracle Cloud Infrastructure HPC」のラインアップは3つのサービスから構成される。それぞれ提供するCPU(AMD、インテル)、GPU(NVDIA)が異なる。9月30日には、NVIDIA A100 Tensor コア GPUのインスタンスの提供が始まった。 Intel Ice LakeのインスタンスとAMD Milanのインスタンスは2021年前半に提供が予定されている。さらに、新たなインスタンスとして、 Ampere Altra Processorが2021年前半に提供される予定だ。

  • 「Oracle Cloud Infrastructure HPC」のラインアップ

  • 2021年前半に提供が予定されているARMインスタンスの概要

続いて、テクノロジー事業戦略統括 ビジネス推進本部 マネージャー 清水美佳子氏が「Oracle Observability and Management Platform」にについて説明を行った。同製品は今年10月に発表された運用管理のサービス群だ。マルチクラウド環境、オンプレミス上のソフトウェアとソフトウェア・スタック全体の可視性と制御を提供し、機械学習によって異常を自動的に検出し、ほぼリアルタイムで修正を行う。

清水氏は、IT運用管理においては、「マルチクラウド、ハイブリッド環境が本格的に導入される一方、システム運用がより煩雑化」「個別最適化されたツールを複数利用することによる効率の低下」「開発者と管理者の連携不足によるDevOpsなシステム開発の阻害」を挙げ、同製品ではこうした課題を解決すると述べた。

  • 日本オラクル テクノロジー事業戦略統括 ビジネス推進本部 マネージャー 清水美佳子氏

同サービスには、Monitoring、Notifications、Events、Functions、Streaming、OS Managementなどの既存サービスに加え、新たに発表されたLogging、Logging Analytics、Database Management、Application Performance Monitoring、Operations Insights、Service Connector Hubが含まれる。

  • 「Oracle Observability and Management Platform」の概要

「Logging」はログの取り込み/管理/分析を容易にするプラットフォームだ。資産全体のロギングをワンクリックで有効化し、 監査・インフラ・データベース・アプリケーションのすべてのログタイプを安全に管理する。オープンなスタンダード技術で構築されており、 ログ収集にfluentdを活用し、CNCF cloudevents 1.0 に準拠している。

「Logging Analytics」は機械学習を適用して、ログからパターンや外れ値を発見してシステムの異常を特定する。ユーザー定義のポリシーに基づいてログをアーカイブおよびリコールできる。

「Operations Insights」は将来のリソース需要とアプリケーションのパフォーマンスに関する洞察を提供する。具体的には、長期の履歴データに基づいてデータベースリソースの使用状況を分析・予測し、 使用率の高いサーバと低いサー特定して、運用コストを最適化する。

「Service Connector Hub」は、OCIとサードパーティサービスとのデータ連携を容易にする。具体的には、「Kafka互換のOCI Streaming serviceを用いて、データをサードパーティの可観測性ツールに簡単に移動させること」「ログメトリックをOCI Monitoringへ簡単に送信すること」「 オブジェクトストレージへワンクリックでログアーカイブすること」「 OCI FunctionsとNotificationsを使用したログイベントの自動修復とアラート通知」が可能。

上記の4つのサービスは現在、東京リージョンで提供されている。以下2つのサービスは今後、リリースされる。

「Application Performance Monitoring」はアプリケーション性能とユーザーエクスペリエンスを可視化し、満足度を導出する。ブラウザからアプリケーションまでのエンドユーザーのパフォーマンスを測定し、サーバ・ブラウザ・トランザクションのメトリックを用いてパフォーマンス、可用性、負荷を分析する。

「Database Management」はオンプレミスとクラウド全体でOracle Database を監視および管理するための統合ビューを抵抗し、ハイブリッド環境における複数データベースの使用状況を一元管理する。

「Oracle Cloud Infrastructure」および「Oracle Dedicated Region Cloud@Customer」のユーザーは同サービスをすぐに利用することができる。