PoCで終わらないデータ分析を目指して2012年にスタート
日立製作所は、2012年からサービスプラットフォーム事業部内にデジタルソリューション推進本部 AIビジネス推進部を設立し、AIを利用したデータ利活用のサービスの提供を行っている。この部門の立ち上げから関わって来た一人が、日立製作所 サービスプラットフォーム事業部 デジタルソリューション推進本部 AIビジネス推進部 部長の吉田順氏だ。
「AIビジネス推進部は、ソフトウェア開発系と研究系の社員を主体に立ち上げました。特にデータ分析を専門にしていた人を集めたわけではなく、自分たちで勉強しながら進んできました。最初から研究ではなく事業として取り組んでいます」と吉田氏は語る。
2012年当時はビッグデータやデータ利活用というキーワードが注目され、各社がさまざまな取り組みを行っていた。しかし、PoC止まりのケースも多く、事業として実際に活用されることのないまま収束してしまうような例も多かった。その状況から脱却するために同社が選択したのが、技術の提供ではなくコンサルティングで企業に深く関わっていく手法だったという。
「たとえば、製造業では故障予兆検知への取り組みは早くから行っていましたが、データ分析やAIで検知自体はできるようになっても、検知後の対応を検討するところで止まっていました。そこで、われわれはコンサルティング部分を強め、業務からデータを見ていく形を採りました」(吉田氏)
事業化できるデータ活用は課題明確化・目標設定のコンサルティングから
「コンサルティングは、顧客の課題や目標をしっかりと聞き出して明確にするところから始めます。経営層から、『うちもデータ活用を行おう』と言われて開始するような案件も多いのですが、まず現場の課題を聞き出します。そして、その課題を解決できたらどのくらいのリターンがあるのかを示していきます」と取り組み方を語るのは、日立製作所 サービスプラットフォーム事業部 デジタルソリューション推進本部 AIビジネス推進部 主任技師の諸橋政幸氏だ。諸橋氏も、部門立ち上げ時からデータ分析利活用コンサルティング業務に従事してきたひとりだ。
日立製作所のユーザーの場合、すでに営業担当やエンジニアを通して課題とそれを解決する方向性が絞られていることも多く、そうした場合に典型的な解決方法を示すための事例も用意しているという。
「アプローチは2種類で、業務知識を持った人が仮説を立てる方法と、明確な根拠はないまま、目標に関係ありそうなデータを使って分析する方法があります。基本的には仮説を立ててデータを集めますが、あまりいい結果が得られない時には、一見関係なさそうな他のデータを使うこともあります。ただ、あまりにも無関係なデータの場合、結果が出ても対策が立てづらく、納得感も得られないので、コントローラブルなデータを使う方がいいと思います。ツールとしては日立の機械学習に加えて、お客様がすでに持っているツールのほか、オープンソースを利用します」(諸橋氏)
たいていの企業には数多くのデータが存在するため、データを選別しながら課題解決に向けて仮説を立て、検証を繰り返す。以前はデータ活用やAIを試してみたいというニーズが多かったが、現在は成果の出る手法が見つかれば、業務システムに採用することを前提に案件を進めるケースが多くなっている。そのため、課題解決のための対策が行えるような分析結果が必要だという。
不足するデータも多すぎるデータも一工夫して活用
利用されるデータは多彩だが、想定しているデータと、実際に存在しているデータが異なるようなケースもよくあり、特に人が手作業で入力するタイプのものが典型だという。
「ECの場合はアクセスデータを利用でき、POSデータが使える流通系もやりやすいと思います。しかし、営業データを人に入力させるものは、内容が欠けていることが多く、まとめて入力していたり、入力内容が大雑把で、訪問した、成約できたというような簡単な内容が入力され、分析に必要な相手の反応が書いていないケースも多いです。これをそのまま分析してしまうと,例えばとにかくたくさん訪問すれば成約が取れるという意味のない結果しか得られません」(諸橋氏)
とはいうものの、これから活用に向けてデータを蓄積するところからスタートするのでは時間がかかりすぎる。思うようなデータが得られない場合は、まず、部分的な成果を見せるという。
「中にはきちんと入力している人はいるので、そのデータだけを使って分析してみることはあります。また、部署全員を対象にするのではなく、データ分析に興味がある一部の人に入力してもらって分析し、結果を見せる時もあります。結果を見せ、モチベーションを揚げてから全体に広げて行くわけです。効果が上がった結果を見せれば,データをしっかり入力しようという人も増えるはずです」(諸橋氏)
また、データ自体が大量にあったとしても、すべて利用するのが最適解とは限らない。古いデータが分析精度を低下させる場合もある。
「ある金融機関での融資与信モデル作成では、過去に作成した与信モデルが、年数が経つにしたがってだんだん現実に当てはまらなくなっていました。作成当時の判断基準が現在の状況に合わなくなっており、精度が下がっていたのです。現場では、人の判断を加えた方が精度が上がるという認識で、半分は人の判断に頼っていました。そこで過去の融資データを利用して新たに与信モデルを作ることになったのですが、大量の古いデータを利用するよりも、近年のデータだけを使う方が精度が上がるとわかり、何年分のデータを使うのが最適かという検証を繰り返しました」(諸橋氏)
結果につなげるための啓蒙や誘導もデータサイエンティストの技術
データ活用がブームになった頃とは違い、現在は予算や体制を整備した上で結果を求める傾向が強まっている。1度は取り組んでみたが、良い結果が出ずにやめたという声や、ツールだけ導入して使いこなせなかったという声を聞くことも増えており、全くの未経験から実験的にチャレンジする例は減っていると両氏は語る。そうしたビジネスに活きる結果が求められるようになってきている中、業界全体で不足していると言われるデータサイエンティストを日立製作所は自社育成している。
「現在、われわれの部署には約60名が在籍しており、その他にフロントBUやグループ会社等から多くのSEが研修として参加しています。日立製作所としては2021年度末までに3000人のデータサイエンティストを育成することを目指していますが、達成は十分可能な速度で進んでいます。座学も行っていますが、やはりOJTが必要だと実感しています」(吉田氏)
Webのアクセスログデータを利用したECサイトでの売上向上といった、因果関係のはっきりしたデータを利用した分析は、すでに社内に点在するデータサイエンティストが手がけるようになっており、そのため、両氏が手がける案件は、活用すべきデータの取捨選択が複雑なもの、課題明確化やテーマ設定といったデータ分析以前の部分が重要なものが多いという。
「データサイエンティストは現在注目されているため学生からの質問もよく受けるのですが、データだけ相手にしていればいいと誤解されているようにも感じます。私の場合はコンサルティング重視、諸橋の場合はデータ加工・分析が得意と人それぞれ役割はあるのですが、難しい案件ではヒアリングやコンサルティングは欠かせません」と社内のデータサイエンティスト数を増やしつつ常に最先端の対応をしていきたいと語る吉田氏は、データサイエンティストという仕事が分析技術やAI技術を駆使するばかりの仕事ではないことを強調した。