米Google Cloudは5月12日(現地時間)、米国で開催中のカンファレンス「Google I/O 2022」で「AlloyDB for PostgreSQL」のプレビュー版を発表した。同日には日本法人であるグーグル・クラウド・ジャパンがメディア向けに説明会を実施した。AlloyDB for PostgreSQLは、PostgreSQLと互換性を持つフルマネージド型のデータベースサービスとなる。
制限のないデータクラウドでデータドリブンなイノベーションを実現
冒頭、グーグル・クラウド・ジャパン ソリューション&テクノロジー部門 技術部長(DB, Analytics&ML)の寳野雄太氏は「2025年までに181ZB(ゼタバイト)のデータが発生すると予測されており、75%もの企業がAIをパイロットからビジネスに定常的に利用することが見込まれている。しかし、そのような投資にもかかわらず、データから計測可能な価値を引き出せていない企業は68%にのぼり、データと価値のギャップは増え続けている」と話す。
同氏は、このようなギャップの要因としてデータの使い方が急激に増え続けているほか、データは組織横断的に利用され、小さなデータは存在しなくなると指摘している。そのため、データドリブンなイノベーションには制限のないデータクラウドが必要だという。具体的には制限のないクラウド、制限のないデータのリーチ、制限のないワークロードにより、データドリブンなイノベーションが実現できるとしている。
寳野氏は「制限のないデータクラウドは、どのようなワークロードもシームレスに扱うことを可能とし、すべての従業ん、顧客、パートナーに利用され、影響を与える。また、どのようなサイズ・種類のデータでもシームレスに扱える」と強調する。
昨今ではレガシなプロプリエイタリデータベースからの刷新の要望が多くあるといい、そのモダナイズ先としてオープンソースデータベースであるPostgreSQLが選ばれるケースが多いが、モダナイズは商用グレードの機能のギャップにより難しいことも多くなっているという。
同氏は、よりよいオープンソース互換データベースとなるための要素として「PostgreSQL」「クラウドネイティブアーキテクチャ」「専門知識を持つエンジニアチーム」「AI/MLのDNA」の4点を挙げている。
すでに、Google Cloudでは分散RDBMS(Relational DataBase Management System:SQLを介し、リレーションナルデータベースを管理するシステム)の「Cloud Spanner」でPostgreSQL互換インタフェースのプレビュー版の提供、フルマネージドリレーショナルデータベースサービスの「Cloud SQL」(PostgreSQL、MySQL、SQL Server)を提供している。
PostgreSQLと完全互換性を持つAlloyDB
そして今回、PostgreSQLをホストするデータクラウド環境として新たにAlloyDBのプレビュー版の提供を開始するというわけだ。
AlloyDBは、PostgreSQLのために設計しており、データベースに最適化されたストレージサービスで構築されており、YouTube、検索、Google マップ、Gmailといった大規模なGoogleのサービス群を動かしているインフラストラクチャと同じビルディングブロックを使用。スタックの各層でコンピュートとストレージを分離して性能向上を図っていることに加え、分析アクセラレーション、組み込みAI/ML、データの自動階層化により、最小限の管理オーバーヘッドで多様なワークロードに対応できるという。
グーグル・クラウド・ジャパン ソリューション&テクノロジー部門 データベース スペシャリスト カスタマーエンジニアの江川大地氏はAlloyDBの内部構成について「Cloud SpannerとCloud SQLでも実装しているコンピュートとストレージの分離を、すべてのレイヤで行っており、高いスケーラビリティを有する。主な特徴としては高い可用性、高いスケーラビリティ、インテリジェント、優れたパフォーマンスの4つだ」と説明する。
最新版の「PostgreSQL 14」と完全互換性を維持しつつ機能するため、既存の開発スキルやツールが再利用でき、既存のPostgreSQLアプリケーションをコード変更なしに移行でき、基盤にPostgreSQLを採用している。
新サービスと標準的なPostgreSQLとの性能比較テストでは、オンライントランザクション処理(OLTP)で4倍以上、分析クエリで最大100倍の高速化が図れることを確認しているほか、Amazon Web Services(AWS)の類似サービス(Amazon Aurora)と比較して、トランザクションワークロードが2倍高速になるという。
Googleのスケールアウトコンピュートとストレージ、可用性、セキュリティ、AI/ML(機械学習)を活用した運用管理の利点と、PostgreSQLとの完全互換性を組み合わせ、企業がミッションクリティカルなアプリケーションを実行する際に期待するパフォーマンス、拡張性、管理性、信頼性を兼ね備えているとしている。
さらに、メンテナンスを含めて99.99%のSLA(Service Level Agreement:サービス品質保証)を実現し、データベースのサイズや負荷に関係なく、大半のデータベース障害を自動的に検出して、数秒以内に回復。
アーキテクチャは、無停止でのインスタンスサイズ変更とデータベースメンテナンスに対応し、プライマリインスタンスは数秒で通常のオペレーションを再開でき、レプリカプールの更新はユーザーに対して透過的に行われれる。これにより、ミッションクリティカルなワークロードにおいて、信頼性と可用性を備えたデータベースを利用することができるという。
カラム型アクセラレータにより、最適化されたカラム型形式でデータをメモリに格納し、高速スキャンと集計を実現しており、最大100倍高速な分析クエリを実現。そのため、ビジネスインテリジェンス(BI)、レポーティング、ハイブリッドトランザクション、および分析ワークロードに適しているほか、アクセラレータは自動配置されるため、ボタンをクリックするだけで分析性能を向上させることを可能としている。
さらに、適応型アルゴリズムと機械学習を用いることでデータベースのパッチ適用、バックアップ、スケーリング、レプリケーションを自動的に処理。ワークロードを学習し、メモリ、超高速セカンダリキャッシュ、高耐久性ストレージにまたがるデータをインテリジェントに整理するという。
これらの自動化機能により、データベース管理者や開発者の管理が簡素化されることに加え、アプリケーション上で機械学習を効果的に活用できるようにサポート。
Google CloudのAIプラットフォームである「Vertex AI」との統合により、ユーザーはクエリやトランザクション内で直接モデルを呼び出すことができる。これにより、アプリケーションのコードを追記することなく、高いスループット、低レイテンシ、インサイトの向上が図れるとしている。
独自ライセンスを不要とし、ストレージのI/O課金がないため、予測しやすい価格設定となっている。そのため、従来よりコスト削減が容易になります。ストレージは自動的にプロビジョニングされるため、使用に応じて課金され、リードレプリカのための追加ストレージコストは発生しない。
なお、データベース移行プログラム「Database Migration Program(英語版ブログ)」を用意。同社がデータベース移行のコストを一部サポートし、Cloud SQLを中心としたマネージドデータベースへの移行を支援しており、OraleからPostgreSQLへのスキーマ変換とデータ移行に対応したサービスのプレビュー版を発表している。