Googleは米国時間2018年9月5日、科学者およびデータジャーナリスト向けにデータセットを検索する「Dataset Search」を公開したことを、公式ブログで発表した。同社は「現在はWebから数千ものデータレポジトリ、何百万ものデータセットにアクセスできる。世界各地の地方自治体や政府もデータを公開してきた。これらのデータへ容易にアクセスし、仕事や知的好奇心を満たすため」にDataset Searchを立ち上げたと説明する。
学術用途の検索サイトである「Google Scholar」と同じく、NASA(米国航空宇宙局)やNOAA(米国海洋大気庁)、ハーバード大学が開発したデータバスのDataverseなど、多くの学術リポジトリを対象に検索が可能。Googleはより良いデータセット検索を目指すため、ガイドラインも用意した。記述形式はGoogle、Microsoft、Yahoo、Yandexによって設立した「schema.org」に準拠し、データ作成者や作成方法、公開日およびデータの使用条件に関する情報を含めることを推奨している。
Dataverse Searchの立ち上げには、NOAA CDOのEd Kearns氏が関わっており、同氏は「公開済みデータへのアクセス環境は、多くの研究者にとって夢だった。データの共有を使命とするNOAAにとって、広範にデータアクセス環境を提供する鍵」と述べた。