【重要キーワード】
●データの抽出、●データの変換、●データのロード(出力)、●データクレンジング、●ETL、●ELT、●EAI、●データ分析基盤、●データウェアハウス(DWH)、●データマート、●リポジトリー、●クエリ、●SQL、●NoSQL、●Oracle Database、●Microsoft SQL Server、●MySQL

収集(生成)したままのデータは、種類や形式が混在している上、不要なデータ(ノイズ)が含まれており、効率的な処理・分析が行えない。

そこで抽出→変換→ロード(出力)という3つのプロセスを経ることになるが、この作業が非常に重要な役割を担っていることは、データ活用においてぜひ理解してほしいポイントだ。

なお、従来はこの3つのプロセスを手作業で行っており、処理エラーの発生、最終的に出力されるデータの品質に対する信頼性の低さといった課題があったが、ETLツールの進化によって状況は一気に改善した。

こうして整理・加工されたデータはデータウェアハウスやデータマートなどに保管され、ようやく活用・分析する準備が整ったことになる。

*  *  *

リンク先から入手できるコンテンツは「いまさら聞けない!『データ活用』のキホン」の第4回目に当たる。データを整理・加工するプロセスの重要性について解説しており、組織のデータ活用を進める際の参考になるはずだ。ぜひ本資料を活用していただければ幸いである。

ダウンロード資料のご案内

マイナビ 提供資料
いまさら聞けない!「データ活用」のキホン 第4回
収集したデータをどう「処理」するのか “使える”状態にする過程とその重要性
> > 資料ダウンロードはこちら

【次回予告】
※本連載の第5回は、2024年12月16日に掲載する予定です。いよいよ「データを分析する」というプロセスについて解説するので、ぜひご覧ください。

[PR]提供:マイナビ