Amazon Web Servicesは2019年8月8日(米国時間)、「AWS Lake Formation – Now Generally Available|AWS News Blog」において、2018年のre:Inventで発表した「AWS Lake Formation」を正式リリースしたと発表した。WS Lake Formationは安全なデータレイクを数日で簡単にセットアップできるサービスで、分散しているデータを集約して分析を容易にする。

  • 資料: Amazon Web Services提供

    資料: Amazon Web Services

データレイクとは、キュレートされた安全な一元的リポジトリであり、すべてのデータが元の形式と分析用に処理された形式の両方で保存される。データレイクを利用することにより、データのサイロ化が解消され、異なる種類の分析を組み合わせることが可能になる。

企業はAmazon S3などのサービスを活用することで、膨大な量のデータを簡単にストアすることができるようになった。ただし多くの場合、構造化されていないさまざまな形式のデータがさまざまな場所に分散的にデプロイされるという状況になっている。AWS Lake Formationはこうした分散しているデータを単一のリポジトリで管理するためのサービス。

AWS Lake Formationが提供するのは多種多様なデータソースの取り込み機能、クリーニング機能、カタログ化機能、データ変換機能など。同様の作業を手動で行おうとすると、かなり煩雑な操作が必要になる。AWS Lake Formationはそうした煩雑な処理を自動化し、構造化されていない多種多様なデータを整理して単一のリポジトリで管理することを実現する。