膨大なデータ群を解析してビジネスに活用可能な知見を発見する。データに基づいた確かな「根拠」によって事業や施策の精度を向上させる。データ サイエンティストが導き出すインサイトは、企業成長や社会課題を解決するうえで欠かせないものです。

しかし、こうしたニーズと裏腹に、優秀な人材は不足しています。一般社団法人データサイエンティスト協会は「データサイエンティスト国内企業採用動向調査 (2020)」の中で、約 6 割ものデータサイエンティスト採用予定企業が、目標としていた人数の確保ができていないことを報告しています。そんな状況の中、合計 100 名近いデータ サイエンティスト、データ アナリストを組織し、ビッグデータに基づいたマーケティング施策を次々と打ち出している企業があります。カルチュア・コンビニエンス・クラブ (CCC) グループの事業会社である CCCマーケティングです。

データ サイエンティストの数が社会に不足している中、どうして CCCマーケティングには人が集まるのか。理由は、国内最大級の顧客基盤に直接触れられるというダイナミックさ、そして、データ サイエンティストにとって充実した職場環境を用意してことにあります。同社は、Microsoft Azure にデータ分析基盤を築くことによって、データベース (DB) アプライアンスを遙かに越えた処理速度とスケーラビリティを実現。ストレスなく、ダイナミックに作業ができる。そんな環境づくりを進めています。

分析の高度化に伴って発生した、処理性能の劣化

CCCグループは、TSUTAYA や蔦屋書店を起点に様々なライフ スタイル事業を展開しています。同グループの「Tポイント」を利用する会員は、実に年間 7,000 万人以上。この膨大な会員データに基づいたマーケティング支援と Tポイントアライアンスの企業支援を一手に担うのが、CCCマーケティングです。

Tポイントのデータプラットフォームは、圧倒的な情報量によって生活者の実像を鮮明にします。ドラッグストアやスーパーマーケットでミネラル ウォーターを買う人はどんな洋服を買う傾向にあるのか。この街の東と西ではその傾向に差異はあるのか。単独の店舗やサービスでは分からないことも、共通ポイント サービスである Tポイントのデータを分析すれば突き止めることができる。これが、同社のマーケティングコンサルティング、 Tポイントアライアンスへ提供する価値なのです。

CRM の高度化、販促の最適化やその効果測定、新商品開発におけるペルソナ、ニーズの可視化、店舗の棚割最適化や出店戦略など、CCCマーケティングでは様々なコンサルティング ソリューションを提供。それを支えているのは、100 名近いデータ サイエンティスト、データ アナリストです。CCCマーケティング株式会社 ITシニアマネージャーの松井 太郎 氏は、データ サイエンティストの下で行われるデータ分析は、年々高度化してきていると話します。

「かつてのマーケティングは年齢、性別、居住地といった人口統計学的な切り口に基づく『デモグラフィック分析』が中心でしたが、近年は、認知、検討、比較といった各ファネルでの反応をアルゴリズムによって評価する『スコアリング』が増えています。また、Aという商品を手に取るユーザーは普段どんなテレビ番組をみているのか、どんな雑誌を読んでいるのかといったような "横断的な『ペルソナ分析』" も重要視されてきています。データ サイエンティストは日々、こうした複数の分析手法を組み合わせながら、企業にとって有益なインサイトを導き出しています」(松井 氏)。

一方で、松井 氏は分析の高度化がある課題を浮かび上がらせているとし、こう続けます。

「それは処理速度です。分析が高度化すればするほど、DB への負荷は指数関数的に増えます。2015 年ごろには、データ サイエンティストから『重い』という悩みをよく聞くようになりました。当時は DB アプライアンスの Oracle Exadata を利用していたのですが、処理に長時間かかるクエリも頻発し、一日中処理が走っている状況でした。DB の容量も 90% に達しており、処理速度の向上とスケーラビリティの確保が喫緊の課題だったのです」(松井 氏)。

こうしたデータベースの「重さ」は、データ アナリストの働き方にも悪影響を引き起こしていました。CCCマーケティング株式会社 データアナリシス企画 データマネジメントユニット ユニットリーダーの大賀 宏昭 氏は、当時をこう振り返ります。

「平日だけでは仕事が終わらないので土日に出社して実行中のクエリが少ない時間に分析を進める、そんな事態が常態化していました。CCCマーケティングにとって、データ分析は『基幹業務』です。それがこのような働き方では不健全だよね、という話が持ち上がっていました」(大賀 氏)。

クラウド不信を、マイクロソフト データセンターの強固なポリシーが払しょく

処理速度が問題となりつつあった 2015 年、世間には、ビッグ データやデータ ドリブンといったキーワードが新たな潮流として押し寄せていました。データの重要性は日に日に高まっており、CCCマーケティングの事業を大きく伸長していくことは誰の目にも明らかです。今後のさらなる成長を支える――そのために、松井 氏はオンプレミスからクラウドへと、IT の在り方をシフトさせることを決意します。

しかし、2015 年当時はクラウドへの不信もまだ根強く残っていました。親会社である CCC 本体の反応は決してポジティブなものではなかったと、松井 氏は苦笑します。

「あの頃はクラウドへの理解が世の中に浸透しておらず、そもそもデータを預けていいのか? セキュリティは安全なのか? といった地点から、法務やセキュリティ、コンプライアンス、IT 基盤など CCC の各責任部門を説得し、協力を得る必要がありました」(松井 氏)。

クラウドという新しい IT インフラは、どうすれば信用してもらえるのでしょうか。潮目が変わったのは 2016 年。Microsoft Azure のデータセンター (DC) 見学がきっかけだったと松井 氏は振り返ります。

「IT やセキュリティ、コンプライアンス部門の責任者のほとんどを連れて行ったことで、パブリック クラウドの DC がいかに信頼できるか、肌で感じてもらうことができました。具体的な運用を見るにつけ、自分たちが普段利用する DC にお願いしていることよりも、それ以上のことをマイクロソフトが徹底していたのです。法規対応やサイバー セキュリティに関するセッションもあり、みんな熱心にメモを取っていました。"クラウドを導入する" という未知のテーマに対する当時の上司の全面的なバックアップもあり、DC 見学や承認プロセスの中で様々な部署や責任者の協力や理解を得られたこと。また、"事業会社が好き勝手にやる" ではなく、全体のガバナンス、それぞれが守るべきものを尊重しながら進めたことで結果的に多くの方の協力を得られた点が、クラウド化実現の大きなポイントだったと思います」(松井 氏)。

Microsoft Azure の DC 見学後、CCC 本体の IT 基盤にも積極的な協力を得られるようになったといいます。有志で作成したセキュリティ ポリシー案を上程し、CCC 本体で情報セキュリティ規約の見直しがおこなわれ、パブリック クラウド利用を前提にしたガイドラインが作成されました。こうした経緯を経て、パブリック クラウドの具体的な検討と概念実証 (PoC) がスタートしたのです。

エンタープライズ水準のサポートと高品質なサービスが、"現場に喜ばれる移行" を実現させる

検討にあたっては、特に「性能」「セキュリティ」「安定性」「移植性」が重要視されました。オンプレミスより性能が飛躍しなければ、移行の意味がありません。また、7,000 万人分の購買データや属性データなどを安全にクラウドに持ち込む必要があります。なおかつ、ミッションクリティカルな業務を止めないために高い水準での SLA (Service Level Agreement : サービス品質保証) が求められました。さらに、CCCマーケティングでは統計分析ツールとして「IBM SPSS Modeler」を利用しており、移植性を理由にこれが利用できない場合には業務に支障が出てしまいます。

これらの事項について慎重に検証するために、CCCマーケティングはグローバルな 2 つのパブリック クラウドを対象に PoC を実施。そして 2017 年、新たなデータ分析基盤として、Microsoft Azure を選定しました。

松井 氏は、選定の理由をこう明かします。

「クエリ実行の多重性の高さ、SQL Server ベースであることで得られる移植性の高さ、トライアル環境の作りやすさ、データサイエンティストのためのサービスが充実しているなど、実際に試すことで分かる魅力が Microsoft Azure には多々ありました。また、マイクロソフトは PaaS を充実させており、『システムは作るものではなく使うもの』という当社のビジネス志向とも合致していました。実際に当社では、データ ウェアハウス (DWH) に Azure Synapse Analytics を利用して、Azure Data Factory なども活用しています。懸念だった IBM SPSS Modeler の移管についても、全面的なサポートを約束して頂けたことが心強かったですね」(松井 氏)。

大賀 氏も、松井 氏が述べたサポートへの評価について同調を示し、移行作業にあたってはマイクロソフトの支援チームに大いに助けられたと語りました。

「DB がSQL Server に変わることで、IBM SPSS Modeler による関数の変更が必要なケースがあり、処理のテンプレートを数百単位で確認する必要がありました。ただ、マイクロソフトのアーキテクトの方々に協力していただいたおかげで、網羅的なチェックをすることができました。また、PoC では従来の6倍の性能が得られる結果となりましたが、実動に際してはケースによって性能が劣化してしまうことがありました。そこで、サポートの方に Azure Synapse Analytics に最適化した処理方法を教えてもらいながら、半年ほどかけてチューニングしていきました。細かいところまで突き詰めていった結果、劇的に処理速度が変わり、現場のデータ サイエンティストに喜んでもらえるようなシステムを構築することができたのです」(大賀 氏)。

IBM SPSS Modeler の完全移植にくわえて、BI ツールで利用する Tableau との連動についても、Microsoft Azure の PaaS を用いて効率化したといいます。

「日次や週次、月次で多くの集計作業が発生するのですが、これをすべて手動でやっていてはとても時間が足りません。そこで、Azure Data Factory の自動設定により集計済みのデータマートを作っておくことで、Tableau を使う際に素早く可視化できるようにしています」(大賀 氏)。

「移行作業では度々トラブルも起きましたが、本国にいるマイクロソフトの開発責任者と直接話し合うなど、柔軟な対応と機能改善をしてもらうことができました。『クラウドがよく分からない』というスタートからつきっきりでサポートしていただけたことには、とても感謝しています」(松井 氏)。

  • Microsoft Azure にあるデータ分析基盤のアーキテクチャ。CCCマーケティングでは従来、2 台用意した Oracle Exadata をストライピングで分散処理することにより性能を担保してきた。今では Azure Synapse Analytics のみで当時以上の性能を出すことに成功している。また、これとは別にセグメンテーション用で利用してきた Oracle ExaData についても、Azure Synapse Analytics に統合。述べ 3 台の DB アプライアンスをクラウド化したほか、2B 向け、2C 向けサービスにあたっても Microsoft Azure を積極的に利用している。

処理速度が飛躍的に向上し、コストも大幅削減。組織風土にも変化が

2019 年CCCマーケティングは Microsoft Azure にある新たなデータ分析基盤を正式にリリースしました。この移行によって、データ サイエンティストの働き方にはどのような変化が現れたのでしょうか。

「Microsoft Azure へ切り替えた当初、『できなかった処理が数分で出せたんです!』と私に言いに来てくれたメンバーがいたことをよく覚えています。また、オンプレミス時代と比べて多重度はさらに上がって、60 多重という場合にも耐えられるようになりました。現在はリモート ワーク中ですが、土日に作業するような働き方は明らかに減っています。かつては一晩中かかっていた処理が 2 時間ほどで終わるようになったので、クライアントにも結果をすぐに返すことが可能となっています」(大賀 氏)。

Oracle Exadata から Microsoft Azure への移行は、コスト的にも大きなメリットをもたらしたと松井 氏は続けます。

「DB アプライアンス 3 本分のシステムを Azure Synapse Analytics に集約したことで、コストを 3 割ほど減らすことができています。データ連携や開発にかかるコストも大幅に落とせました。くわえて、以前は容量不足で構築が難しかったデータ マートも、必要に応じて追加できるようになり、主要企業を横断した統合的なものやKPI用、企業別のデータ マートなども柔軟に追加できるようになりました」(松井 氏)。

クラウド シフトの効果は性能やコストだけに留まりません。Microsoft Azureという基盤は、組織の風土にも変革をもたらしつつあると松井 氏は言います。

「クラウドという自由度と柔軟性の高い基盤を得たことによって、これまでベンダーに依頼しなければならなかったことでも、自分たちでチャレンジできるようになりました。データサイエンティストに限らず、データアナリストなどの職種でも、ここ1、2年、SQL や Python の勉強会をずっと開催しており、CCCマーケティングに『まずやってみよう』という文化が根付きつつあるように思います」(松井 氏)。

"7000 万人へのデータ分析とそれを基盤としたCRMや商品開発のコンサルティングおよび販促サービスは弊社の基幹事業であり、それがゆえに一般的な DWH 利用と比べ、はるかにミッション クリティカルな SLA を求めています。新しい技術を取り入れ、進化し続ける。一方でそれでもなお安定度を失なわず、より安定し続ける。そんな DB、サービス、クラウドが、弊社として最良のプラットフォームです。現段階でマイクロソフトは、それを提供するパートナーだと考えています。"

-松井 太郎 氏: ITシニアマネージャー
CCCマーケティング株式会社

AI サービスを応用することで、さらにスピーディな分析を実現していく

「まずやってみよう」という風土は、CCCマーケティングのビジネス スピードにさらなる加速をもたらしています。同社では今、どんなことが進められているのでしょうか。松井 氏は、今後の構想も交え、こう語ります。

「データ サイエンティストにとっての利便性向上は欠かすことができません。まずは分析環境をより早く、使いやすくしていく。そしてその上で、『分析と販促の統合』を進めていきたいと考えています。今はこの 2 つは人が人力で繋げていますが、Microsoft Azure の Data Factory や Cognitive Services の学習済みモデルを活用することによって、AI 化や自動化が進められると思っています。実際に幾つかは検証段階にまで進んでいますので、データ サイエンティストが生み出すアルゴリズムによるマーケティング施策をシステム上で効率良く実現できるように進めていきたいと考えています。また分析、販促に留まらず、社内業務などでも Microsoft Azure の様々なサービスが適用できると考えています。例としては、Cognitive Services と Azure Bot Services を活用し、社内業務の問い合わせ Chat Bot をわずか 2 か月で、内製により構築し、提供しています。このような従来の業務や手順にとらわれない変革マインドも、Microsoft Azure の様々なサービスを知ることでより醸成されると考えています」(松井 氏)。

サービス価値を向上させるために、確固たる「データ」が欠かせない時代となりました。活用できるデータを得るためには、分析のトライ アンド エラーが必要です。Microsoft Azure に構築した分析基盤は、様々なチャレンジを迅速かつストレス レスに行える環境として、1 つの最適解となるでしょう。これを活用することで、CCCマーケティングのデータアナリストは今後、ますます力を発揮していくはずです。

[PR]提供:日本マイクロソフト