現在、あらゆるシーンで、データ活用やデジタルトランスフォーメーション(DX)を推進することが求められているが、そもそもどんなデータを、どう活用すれば、どんな効果につなげられるのかに悩む企業も、まだまだ多いだろう。
マイナビニュースではデータ活用に関する課題解決の糸口を提供すべく、2020年12月、データ活用の最新手法や企業の成功事例を紹介するオンラインセミナー「マイナビニュースフォーラム 2020 Winter for データ活用 ~ニューノーマルに備えるデータ戦略~」を開催した。
本稿では「西内啓が解説!金融業界におけるデータ分析最前線」と題して行われた講演の概要を紹介する。タイトルに「金融業界」とあるが、それ以外の業界にも十分参考になる内容となっているので、ぜひご一読いただきたい。
普通のビジネスマンがデータサイエンスを活用する時代に
講演者の西内 啓氏は、株式会社データビークル 代表取締役 最高製品責任者であり、かつては東京大学で統計学を研究していた経歴を持つ人物だ。氏はデータの統計的分析と、そこから得られたエビデンスに基づいてアクションを起こすことの重要性を説く。
こうした考えは1990年代に医学界で「EBM(Evidence Based Medicine:根拠に基づく医療)」として提唱されてから各界に広まり、2000年代に入ると経営学の世界でも「データで裏付けられた理論を実際の経営にも活かそう」という、いわゆるデータドリブン経営の動きが始まった。実際、データ分析に関する投資をした場合、ROIは平均13倍になり、データドリブンに意思決定する会社は生産性が5~6%高まるという調査報告も出ていると、氏は説明する。
また「データを活用・理解して、そこから価値を引き出す仕事は重要で、統計の専門家だけに任せていいことではない」というGoogleのチーフエコノミスト、ハル・バリアン氏の言葉を引用しながら、今、重要になってきているのは、企業の管理職・経営層にいる人たち自身がデータにアクセスし、洞察を得て、それを現場に伝えていくスキルを持つことだと、氏は言う。
「ガートナーも、普通のビジネスマンが自分たち自身でデータサイエンスを活用できる時代が来ると言っています」(西内氏)
ではデータ活用とは、具体的にはどのようなことを指すのだろうか。氏は「データ」「分析」「意思決定」「現場」というサイクルを、途切れなく回していくことだと言う。
「データが沢山あるだけではダメで、それを実際に分析可能な状態まで持っていかなければならない。そして分析できる状態が整ったら、課題に対して適切な分析手法を選ばねばならない。次に大切なのは意思決定というステップで、分析結果からどんなアクションを取るかの意思決定をする。その決定に沿って現場が動いた結果、どれくらい効果があったかの検証を行う。それをさらに分析することで、次のより良い意思決定につながっていくのです」(西内氏)
データ活用のサイクルを止める要因とは?
しかしこうしたサイクルがどこかで止まり、データ活用が進んでいない事例を、西内氏は多数見てきたという。データがあっても分析できる状態にすることが困難だったり、AIを使ってみたものの課題が何も解決しなかったり、また分析結果の意味が分からず、アクションにまでつながらないという例や、たとえアクションまで行えたとしても、効果検証をしないために次の施策を打てないでいるケースもあるという。
サイクルを止める大きな問題となっているのが、分析にかける前処理であるデータ加工のプロセスだ。アメリカのクラウドソーシング会社が、データサイエンティストに「何に一番時間を使っているか」を聞いたところ、63%が「データ加工」と回答したという調査結果からも、データ加工にどれだけ時間を費やしているのかが分かる。
データ加工の次に問題となるのが、適切な分析手法をどう選ぶかということだ。ガートナーではデータの扱い方を3つに分類しているという。
ひとつは記述的分析。過去に何が起きたか正確に把握するためのもので、BIツールはこの分析を行うためによく利用されている。
次に診断的分析。過去に起きたことを分析して、「なぜ起きたのか」の原因を探していくものだ。
たとえば出店計画では、過去のデータから「近隣にこういうタイプの人が住んでいて、こういう施設が近くにある店舗はパフォーマンスが高い」と分かれば、闇雲に出店するよりも高いリターンを得られる出店計画を立てられるようになる。このように実績データの背景にある、これまで気づかなかったような意外な要因を見つけていこうというのが診断的分析だ。
最後に予測的分析。現状を前提とした場合の今後の推移を予測するためのもので、AIや機械学習と相性がいい。
それぞれの分析を用いるにあたっては、注意点もある。記述的分析に使っているBIツールで、実績データの中にある意外な関連性や仮説を人力で見つけようとすれば、様々なグラフを書き出したり比較したりする必要があり、担当者が疲弊してしまう。またAIは予測的分析などには有用だが、結果を導き出すまでのプロセスがブラックボックス化しており、なぜその結果が出たのかが分からない。そのため予測値以上の成果を得るための改善策を考えようとすれば、やはり人間が診断的分析をする必要が出てくる。
「意思決定の透明性が確保されていないのが現状のAIの問題で、いかに透明性や説明性を上げていくかが課題となっています」(西内氏)
さらにAIが人の気づかないところで、性別や人種といった、差別につながりかねない属性を分析に用いてしまうという可能性もあり得る。何かのきっかけでそのことが露呈すれば、炎上は必至だろう。こうした事態を避けるため、「説明可能なAI」という領域が注目されるようになっていると、西内氏は言う。
診断的分析の大きな課題は、コストだ。大企業が導入するクラスのSASやSPSSは、1,000万円程度の投資が必要になる。加えて、そうしたツールを使いこなすにはデータサイエンティストを雇わねばならないことが多く、その外注費用を考えれば投資額は1億円以上にもなってしまう。さらに分析チームが業務に詳しくないと、「業界の常識」を分析結果として上げてきてしまったり、現場の実態に合わない結果になったりすることもある。
「頑張ってコストをかけて診断的分析プロジェクトを実施しても、意思決定や現場の業務改善に役立っていないということが、多くの企業で起こっています」(西内氏)
診断・予測分析を容易にするクラウドサービス「Data Diver」
データビークルではこうした課題を解決し、データの準備から意思決定までを支援するクラウドサービスとして「dataDiver」を開発・提供している。企業が保有する業務データを投入すれば、数秒から数十秒で分析用データが自動生成できるようになっており、その分析用データから重要な変数となるものを自動的に探索する機能も搭載されている。
「dataDiver」はそうした変数の組み合わせによって分析を行うため、「どういう根拠に基づいて分析された結果なのか」をシンプルに説明することができる。ブラックボックス化が避けられるだけでなく、人がそれぞれ変数の値を変更して、シミュレーションに使うことも可能だ。
操作もシンプルだ。分析の目的を設定する画面では、「AごとにみたBのCがD」という文章のA~Dにあたる内容をプルダウンメニューから選ぶだけで、分析の切り口を設定できる、たとえば「(A:顧客)ごとにみた(B:購入価格)の(C:合計)が(D:少ないことが課題)」と入力するだけで、重要な影響要因を自然言語で表示してくれる。
西内氏は、ガートナーが「人間の認知機能を拡張させて、データにアクセスしやすくすること」として提唱する「拡張アナリティクス」という概念を紹介し、「dataDiver」はこの概念を実現するツールだと言う。データの準備や洞察の生成・可視化など、従来データサイエンティストが行ってきたことの多くを自動化できるからだ。
「dataDiver」を用いて「望ましいもの」と「望ましくないもの」を比較し、両者のどこに違いがあるかを見つければ、事業を望ましい方向に変えるアクションがとれるようになると、西内氏は言う。
たとえば「優良顧客(望ましいもの)は、Aというイメージをよく持っている」ということがデータから分かれば、Aというイメージを与える広告を打って、新たな優良顧客の育成につながるアクションを起こせる。また、優良顧客が集まりやすい場所や、よく見ているメディアが分かれば、効率的なリーチが可能になるだろう。さらに優良顧客になりにくい人(望ましくないもの)の特徴を掴めれば、そういう特徴を持った人にも「対応可能」なツール・サービスを開発することで、ブルーオーシャンの開拓ができるかもしれない。 こうしたアクションの効果を測定し、満足いく精度の予測モデルが完成したら、予測値に応じて仕入れや生産量などのリソースを最適化することも大切だと、西内氏は言う。
「データドリブンによる意志決定は大きな利益を生みます。データから洞察を得て、変える・狙う・大丈夫にする・最適化するアクションを起こしましょう。『dataDiver』を通じて、データサイエンスの技術を皆さんにご活用いただければ幸いです」(西内氏)
[PR]提供:データビークル