膨大なデータの中から新しい情報や知識を得るのに有益な「データマイニング」という技術。新しい技術かと思いきや、実は100年以上前から存在し、1930年代にはすでに知られていました。効果的なマーケティング手法として知られ、さまざまな業界で活用されています。
本記事では、そんなデータマイニングの意味や歴史について解説し、実際に活用する際の効果的な方法などを紹介していきます。また、どのような業界でどのように活用されているのか、事例を具体的に解説します。
データマイニングとは
データを解析して有益な情報や知識を見つけ出す技術やその概念を、「データマイニング」といいます。
コンピューターやモバイルガジェットが普及したことで、扱うデータの数が膨大化しています。そのビッグデータの中から有益な情報や知識を見つけ出すことは、企業にとって非常に重要なこととなっています。
■データマイニングは100年以上前から存在していた
データマイニングはコンピューターが普及したデジタル世代に誕生したと考えられがちですが、実は100年以上も前から存在していた概念です。1936年にコンピューターと同じような計算を実行できる機械が発明されたことがきっかけで、データマイニングに注目が集まるようになりました。
企業が扱うデータが膨大化してきた現代、再びデータマイニングに注目が集まっています。企業活動の指針を決めたり、改善点を洗い出したりと、データの中にある有益な情報がビジネスを支える存在となりつつあるのです。
■データマイニングの分析手法 (1)
データマイニングでは、主に以下のような3つの分析手法が用いられます。
- 分析手法 (1) クラスタリング
似ているデータごとにグループわけをする手法のことです。ある商品の購買データを分析し、似ている商品を購入している顧客を分類します。そのグループごとに最適なアプローチをかけることで、購買確率を上昇させることができます。
- 分析手法 (2) ロジスティック回帰分析
特定の現象や条件の有無を判断するのに役に立つ、明確にYESかNOが定義できる場合に用いる分析方法です。例えば、キャンペーンを実施した時に、対象となる顧客が商品を購入したかしていないかをデータ化し、購入してくれる確率などを調べることができます。そうすることで、どの程度の人がキャンペーンによって購入してくれるのか期待値を探ることができます。
- 分析手法 (3) マーケット・バスケット分析
ある商品と購入されやすい商品の組み合わせを分析するための手法です。小売店などで、どんな商品とどんな商品を近くに陳列すれば購買率が上がるかがわかります。意外な分析結果が得られることも多く、陳列棚の配置を決める際などに有効です。
データマイニングでわかること
データマイニングでは、膨大な量のデータの中から有意義な情報を探し出すことを目的としていますが、大きく分けて3つの機能を持っています。どの機能を求めて解析するかによって、用いる手法が異なってきますので、目的を明確化することで適切なデータを手に入れることができます。
■特定の事象が発生する確率
購入など特定の事象が発生する確率を求めることができます。データと特定の事象の関連性を見つけて、結果を予測するだけでなく、その発生要因についても探ることができます。
例えば、ある商品の購買データを分析することで、どんな人に購入確率が高いのか、どんな時期に購入される傾向にあるのかといった確率を求めることができます。
■データを特徴ごとに分類
対象となるデータを特徴や条件別に分類することができます。例えば、ある商品に関心があるかどうかを分類したり、キャンペーンの結果購入したか否かを分類したり、グループわけすることでマーケティングに役立てることができます。グループごとに傾向を押さえたアプローチができるので、効果的な販売方法を採用することができるのです。
■相関関係を抽出
データの中から、同時に発生しやすいものや相関関係の薄いものを探すなど、相関関係を探ることができます。例えば、一緒に購入されやすいものの関係性を探る、同じ時期に購入されやすいものの関係性を探るのに役に立ちます。
これまでは見えていなかった共通点を見つけることができ、マーケティングに役に立ったり、陳列棚の効果的な配置を見つけたりすることができます。
効果的なデータマイニングの手順について
データマイニングは以下のような手順で行います。
■目的に合ったデータを集める
有益なデータを探し出すためには、目的に合ったデータを用意しなくてはなりません。どんな商品が同時に購入される傾向にあるかを知りたいのに、1つの商品データしかないのでは分析しようがないはずです。有益な情報を手に入れるためにも、どんな目的でどんなデータが欲しいのかを明確にして、それに合致したデータを用意する必要があります。
■収集したデータを加工する
次に、収集したデータをクレンジング加工します。使えないデータや壊れたデータを除外して、スムーズに分析が行えるように処理をします。データがある程度そろったところで、形式の整理や重複データの削除などのデータ整理を行いましょう。
■分析手法に基づいてデータを分析する
先述した分析手法の中で適切なものを選んで、有益なデータを得るために分析を進めます。データの関連性を見つけたり、グループ化したりして、マーケティングに役立ちそうな情報を見つけ出していきます。
■結果を参考に検証や評価をする
分析が終わって有益な情報を見つけ出すことができたら、その分析結果に基づいて検証や評価をしていきます。分析結果を正しく評価することができれば、効果的なアプローチを導き出すことができるでしょう。
業界別データマイニング活用事例
データマイニングは実際の業界でどのように活用されているのでしょうか。それぞれの業界での活用例を具体的に紹介していきます。
■金融関連
金融の世界では日々世界の情勢が変わり、膨大な量の取り引きが行われます。大量の取り引きにデータマイニングを活用すれば、不正やリスクを早い段階で見つけたり、今後の取り引きの方針を決定したりすることができるでしょう。
具体的には、住宅ローンの審査で、融資の可否を顧客の特徴や属性から判断する仕組みを活用したり、クレジットカードの購入額や日付を分析することで不正利用を探したりすることに活用できます。
■製造業
需要と供給のバランスをとることが重要な業界なので、生産性を確認したり設備のメンテナンスの時期を調整したりするのにも役に立ちます。
具体的には、どの機械でどのくらいの生産性が見込めるのかを分析する、どんなタイミングでどんな故障が起きやすいのかを事前に把握しておいて、的確なタイミングでメンテナンスをする、など。メンテナンスの時期を計画的に決めることができるので、生産効率を下げることなく製造し続けることができます。
■医療関係
医療機器を使って検査ができても、最終的に病気かどうかの判断を下すのは医師の仕事です。医師の経験や知識により、同じ症例であっても判断が異なる場合もあります。
こういった場合に病気の見落としがないように、症状と病気の関連性や、薬と病気の関連性を見つけ出すためにデータマイニングが活用されています。これまで見落としがちだった病気なども、データマイニングによって見つけ出せる可能性が上昇します。
■教育関連
個々の生徒にあわせた学力や成績の分析を行うことで、それぞれにあった授業内容や課題を決めたり、学力アップのための効果的なアプローチを導き出したりすることが可能になります。
例えば、それぞれの生徒の得意な分野を導き出したり、タイプ別に効果的な勉強法を導き出してそれぞれのタイプ別に違ったアプローチで教育を行ったりことができます。過去の生徒のデータを参照することで、ある生徒の成績が今後どのように推移するかも予測することが可能です。
データマイニングを効果的に活用しよう
データマイニングの技術を使えば、膨大なデータの中から目的に合った有益な情報を得ることができ、利益のために活用できるようになります。そのためには的確なデータを用いることや、効果的な分析方法を使うことが重要です。
教育現場や医療現場でも活用されているデータマイニング。それぞれの活用例を具体的に把握して、自身の専門分野でも活用してみてはいかがでしょう。