ビッグデータ分析における3つの「困った」
- ☑膨大なデータのマイニングをどのように進めていけばよいか分からない
- ☑データが社内に散財し、かつツールに取り込めないファイル形式が存在する
- ☑分析に手間がかかる上、結果の評価や検証、再分析が困難
→データマイニング・プロジェクトにおいて発生する、
これらの「困った」を解決する手段はこちら
ビッグデータ分析に適切なデータマイニングのプロセスとは
ビッグデータ時代の到来により、データマイニングの重要性が高まっている。発掘(マイニング)という言葉が示す通り、大量に存在するデータ群から様々な相関関係や傾向を導き出すこの技術は、企業がビジネスを展開するにおいて必要不可欠なものになるだろう。
ただし、データマイニングのプロジェクトを効果的に進めるには、適切なデータマイニングのプロセスを採用することが重要となる。さらには、利用するデータマイニングツールがこのプロセスに適合していること、また、自社のビジネスやシステム環境に合うことも重要だ。プロセスやツールが合わないものだったとしたら、意味のない分析ばかりになり結果として期待外れの投資となってしまう。
効果的なデータマイニングのプロセスを理解し、データマイニングツールを評価する
データマイニングの標準的なプロセスとしてCRISP-DM(CRoss-Industry Standard Process for Data Mining)と呼ばれるものがある。これはSPSS、NCR、ダイムラークライスラー、OHRAなどがメンバーになったコンソーシアムで開発されたもので、非常に汎用性が高いプロセスと言われている。なお、CRISP-DMは以下の6つのフェーズで構成されている。
- フェーズ1:ビジネスの理解
- フェーズ2:データの理解
- フェーズ3:データの準備
- フェーズ4:モデリング
- フェーズ5:評価
- フェーズ6:展開
この6つのフェーズを元にしたチェックリストでデータマイニングツールを評価していけば、自社にとって本当に必要なものを選択することが可能となるだろう。
以下のホワイトペーパーには、CRISP-DMの6フェーズに基づいた「評価チェックシート」の詳細、およびその他の考慮事項についての解説が記載されている。
データマイニングツールの選定のみならず、データ分析の手順について頭を悩ます方にとっても、大きな参考になるはずだ。
< 詳細はホワイトペーパーで配布中 ⇒ ダウンロードはこちら >
※ダウンロードにはお名前や勤務先情報のご入力が必要です。
※個人情報の取り扱いにつきましては、 ダウンロードページでご確認ください
(マイナビニュース広告企画:提供 日本アイ・ビー・エム株式会社)
[PR]提供:日本アイ・ビー・エム