アイ・ティ・アール リサーチ統括ディレクター シニア・アナリスト 生熊 清司氏

外資系コンピューターメーカーを経てコグノス社の日本法人の立ち上げに携わり、日本オラクルではデータベース製品のマーケティングおよびアナリストリレーション部門の日本代表などを務め、2006年からはアイ・ティ・アールのリサーチ統括ディレクター/シニア・アナリストとして活躍──。そんな輝かしい経歴を持つ生熊清司氏が、7月19日に開催された「マイナビニュース ビッグデータ活用・保全セミナー」に登壇した。同氏のセッションでは、ビッグデータがビジネスにイノベーションをもたらすことができるよう、どのような基盤を構築し、いかに活用していけばいいのかについて、企業が抑えるべきポイントが示された。

「行動」に移さねば"ビッグデータ活用"とは呼べない

一般的に、ビッグデータについての解説では、「量(Volume)」、「更新頻度(Velocity)」、「多様性(Variety)」という、いわゆる「3V」が用いられることが多い。しかしこの3Vは、ビッグデータが"従来の技術や手法では処理しきれないような、多量で多様なデータの集まり"であるという、いわばビッグデータの"特性"を示しているに過ぎないのだ。

生熊氏は次のように強調する。「3Vだけでは、ビッグデータの本質そのものに迫ることはできない。ビッグデータの本質とは"データを分析し、情報をビジネスに活用すること"であり、そのためには、『収集(Acquire)』、『分析(Analyze)』、『活用(Action)』といった『3A』の視点が重要となるのだ」

同氏の主張を噛み砕けば、ビッグデータを分析し、何らかの知見を得られたとしても、それだけではビッグデータを活用したことにならないのだ。その知見をベースとして実際にビジネスでの行動を起こし、最終的にビジネス上の有益な価値を生み出すことができてこそ、はじめてビッグデータを活用できたことになるのである。

ビッグデータへの期待は大きいが、「何から手をつければいいのかわからない」現実

とはいえ、ビッグデータはもはや"ベンダーの宣伝文句"や"単なるバズワード"ではなくなってきているようだ。アイ・ティ・アールの独自調査によれば、(データウェアハウス(DWH)を導入している)国内企業のうち実に5割弱が、ビッグデータを「最優先事項」もしくは「優先事項」として位置づけているのである。そしてビッグデータを利用したい業務領域については、「マーケティング」が7割近くと断トツのトップであり、次に「営業」が5割弱と続いている。

これまで、企業にとってITは、主に運用管理や業務効率化、生産性の向上といった領域で活用されてきており、IT投資を行う際には、これらの領域でどれだけの効果が見込めるかという、費用対効果の視点が重要であった。しかしながら、ビッグデータ活用に期待されている「ビジネスチャンスの拡大を生むイノベーション基盤」といった分野は、これまでITが得意としてきた領域とは異なる。そのため、従来ながらの費用対効果といった視点では説明が難しく、そのことが導入の障壁となるケースも少なくない。さらに、データ分析を行うとともにその結果をビジネス現場で活用するよう促す「データサイエンティスト」の確保が難しいというのも、新たなビッグデータへの取り組みを困難にしている。

そして、そもそも多くの企業にとっては、ビッグデータへの期待は大きいものの、いったいどこから取り組めばいいのかわからない、というのが実情なのではないだろうか。

ビッグデータの取り組みを"着実に"進めるステージとは

こうした背景を受けて生熊氏は、企業がビッグデータ活用に取り組む際には、いくつかのステージに分けて段階的に進めていくことを推奨する。

まず最初のステージ行うべきは、「ハードウェアのパフォーマンスを上げること」である。ビッグデータは、3Vで説明されるように、非常に多様なデータの集合体だ。しかし多様ではあるが、データの種類は「既存のデータソース」と、「新規のデータソース」の2つに大きく分けることができる。業務システムからのトランザクションデータやPOSデータ、オフィス文書や電子メールのデータといったものが既存のデータソースであり、ソーシャルメディアや各種センサー/マシンから出力されるデータなどが新たなデータソースに属する。これら2つの種類のデータを合わせるとその容量は途方もない大きさとなるため、ハードウェアのデータ処理能力を向上させる必要があるのだ。

「"そこまで処理能力を上げなくとも、正しい判断を行うに足りる最低限のデータさえあれば十分なのではないか?"という疑問を持つ企業も存在する。確かに、統計という観点から言えば、必要なサンプルさえ集めることができれば、すべてのデータを揃えておく必要はないだろう。しかし、次に視点を変えて判断したい場合には、別途必要なサンプルを集め直さなければならなくなる。つまり、視点の数だけサンプルが必要となってしまうのだ。これに対し、すべてのデータを"ビッグデータ"として保持しておけば、どのような視点であろうとも、正しい判断を行うに足りるデータを用意することができるようになる。視点を変えて分析をしたいのであれば、ビッグデータは不可欠と言えるだろう」(生熊氏)

出典:ITR User View 2013

次のステージは、「データ分析プロセスの構築」だ。生熊氏が提唱するデータ分析プロセスは、「データの収集と選択」、「データのリポジトリの整備」、「分析モデルの開発」、「分析の展開と利用」という4つのアクションから構成されている。これら4つのサイクルを回すことで、分析プロセスが成果を生み出せるようになるわけだ。具体的には、既存のデータソースと新規のデータソースからなるビッグデータを、この分析プロセスを経由させることで、新たな情報を生み出すことが可能となるのである。

ただし、データ分析プロセスは、企業ごとに最適な手法が異なるため、トライアンドエラーを繰り返しながら自社に合った手法を見つけていく必要がある。そこで、分析プロセスが軌道に乗るまでは、コンサルティングサービスを利用したり、ベンダーが提供しているビッグデータのソリューションを導入したりしながら、そこで示された方法を適用し、運用していくという方法も有効だと言える。そうした既存のノウハウを活用し、運用していく中で、自社に合致した最適な分析プロセスを構築していくことができるのである。

データ分析のポイントについて、生熊氏は次のようにアドバイスを送る。「カギを握るのは、テキスト分析だ。最近の企業の情報システムでは、生産性や業務効率を向上させる目的で電子メールや企業内SNSの導入を進めている。また、インターネット上のソーシャルメディアや検索ランキングなどもビッグデータの対象となる。こういったツールの多くが、テキストデータから成り立っているのである。このように、ビッグデータの中には、非常に多くのテキストデータが蓄積されているにもかかわらず、その活用はまだまだ限定的だ。これらのテキストデータを分析することによって、市場動向や顧客動向、さらには競合他社の分析なども可能になるということをぜひ心に留めておいていただきたい」

深刻な"データサイエンティスト不足"は「チーム力」で補うべし

ここまでのステージを踏むことで、ビッグデータを活用するための素地はできあがったことだろう。そして次となるステージで生熊氏は、組織を「分析チーム」と「システム開発チーム」に分け、両者を連携させることを提唱する。これは、分析チームとシステム開発チームの性質の違いを熟慮した結果だという。

まずデータ分析チームには、可能な限りITリソースを使いながらデータの多様性を重視する傾向がある。また、実験的な分析を繰り返す一方で、システムの管理については重要視しないという性質も見られがちだ。一方、システム開発チームの場合は、効率的にITリソースを使い、データの品質やシステム管理を重視する傾向が顕著である。このように、2つのチームの特性は全く異なるのだ。

そこで、データ分析チームには自由に使えるITリソースを「サンドボックス」として割り当て、彼らを有用な情報提供プロバイダーとして活用するようにする。そして、そこから得られた知見をシステム開発チームが実装・展開し、ユーザーによるモニタリングを通して、仮説の立案などにつなげていくというのが生熊氏の考えだ。このようなチーム連携の流れをつくることで、ビッグデータを活用し、ビジネスに利益をもたらすことが期待できるのである。

また生熊氏は、多くの企業が頭を悩ませているデータサイエンティストの獲得についても次のように進言する。「ビッグデータが話題になる中で、データを分析して新たな知見を発見し、さらにその知見を基にビジネス現場での実践へと誘う"データサイエンティスト"が脚光を浴びている。しかし、データサイエンティストとは、ITスキルやビジネススキル、分析スキル、そしてコミュニケーションスキルなど、実に多くのスキルを有する希少な人材であり、現在のところその獲得は非常に困難だ。そこで、データサイエンティストを獲得するのではなく、企業内の人材によりデータサイエンティストと同等の役割を担うことができるチームを発足させるほうが現実的だと言えるだろう」

実際、企業内を見渡せば、いくつかのスキルセットを保持している人材は少なくないはずだ。データベースに関する知識を持つ人材もいれば、データの統計解析を得意とする人材もいるだろう。業務に関する専門知識やシステム化についてのスキルセットを持つ人材などは比較的確保しやすいのではないか。それらの人材を集め、チームとして一体的に機能できるようにすることで、1人のデータサイエンティストに匹敵するスキルセットを確保し、"データサイエンティスト・チーム"として活用するのである。これならば、世界中で引っ張りだことなっているデータサイエンティストを獲得するよりも、難しくないはずだ。

ビッグデータを活用することで、IT部門は経営により直接的に貢献することが期待できるようになる。つまり、企業のCIOやITマネージャーは、今こそ新たなデータの分析に乗り出し、IT部門がこれまで以上に有用な情報プロバイダーとなるべく具体的な取り組みを開始すべきなのである。

最後に生熊氏は、「ビッグデータとは、ビジネスに直接貢献することができるIT戦略であり、イノベーションのための基盤となりうる存在だ。皆さんにはぜひ3Aの視点、つまり"データは使ってこそ価値を生む"ということを忘れずに、ビッグデータの活用に取り組んでいただきたい」と会場に向けて訴えかけ、セッションを締めくくった。

■記事についての問い合わせ
株式会社キング・テック
メール:sales@kingtech.co.jp
電話:03-5643-2671

[PR]提供: