特に比較対象となるのが、クラウド上で稼働する「Snowflake」と「Azure Databricks」の2製品である。両者ともデータ活用を可能にするための優れたサービスを提供しており、企業がビジネスの成長と向上を目指す上で選択肢となっている。
Snowflakeは、クラウド上で動作するデータウェアハウス(DWH)サービスであり、様々なデータソースからの情報を一元化し、分析やレポート作成を容易にする。これまでのDWHと異なり、ストレージとコンピューティングを分離することでスケーラビリティとパフォーマンスを向上させている。
Databricksはデータレイクハウスと呼ばれる新たな形態のデータ管理プラットフォームを提供している。従来のDWHとデータレイクの”イイとこ取り”をしたこのプラットフォームは、大量の非構造化データを格納し、分析することを可能にする。データの可視化だけでなく、AIや機械学習までワンプラットフォームで実現できるため、管理運用負荷を高めることなく、これまでにない新たなビジネスインサイトの発見を支援する。
SnowflakeとDatabricks、どちらもその特性と機能性から広く利用されており、どちらを選択すべきかは、それぞれの企業のビジネス要件や目標により異なる。しかし比較検討する上で特に気になるのはパフォーマンスやコストといった定量的な数値ではないだろうか。
日商エレクトロニクス 提供資料
SnowflakeとAzure Databricks比較検証レポート
> > 資料ダウンロードはこちら
クラウドDWHとのパフォーマンス比較
実はクラウドDWHとのパフォーマンス比較は米データブリックス社がブログで公開している。
2021年のパフォーマンス検証の結果、DatabricksはSnowflakeよりも2.6倍高速で動作するということが分かったとのことだ。
これはTPC-DCというデータベースシステムの性能を客観的に測定するベンチマークを用いたものであり、TCP評議会によって正式に認められている結果である。
では、直近の数字はどうなのか、日本での検証でも同じなのか、気になる方も多くいるだろう。
* * *
以下のリンク先から入手できるコンテンツでは、日商エレクトロニクスがこれらSnowflakeとDatabricksを比較検証した結果をまとめている。パフォーマンスとコストの違いを具体的な数字で比較できるため、データ活用基盤を検討中の方にはぜひ手に取ってみてほしい。最適な選択の一助になるだろう。
ダウンロード資料のご案内
日商エレクトロニクス 提供資料
SnowflakeとAzure Databricks比較検証レポート
> > 資料ダウンロードはこちら
[PR]提供:日商エレクトロニクス