データ分析環境として、Databricks(データブリックス)を導入した東芝データ。今回、導入までの経緯や効果について、東芝データ 技術部フェロー 兼 技術第二グループ長 博士(工学)の城田祐介氏と、同 技術部 博士(情報学)の金井達徳氏の話を紹介する。

  • 左から金井達徳氏、城田祐介氏

    左から金井達徳氏、城田祐介氏

レシートデータの分析基盤構築が急務となっていた東芝データ

東芝データは、2020年2月に設立された。東芝グループのセキュリティ技術とノウハウを基盤に、人々の購買動向をはじめ、健康、人材、行動など実社会で収集したデータを高度なデジタル技術で分析し、活用しやすい情報に加工して実社会に還元することで、豊かな未来を創造するデータ循環型のエコシステムの構築を目的としている。

同社を立ち上げるきっかけとなったのは、東芝のグループ会社である東芝テックが提供する電子レシートサービス「スマートレシート」のデータ活用が急務となっていた。

スマートレシートは、店舗におけるPOSシステムのレシートデータを会員の同意にもとづき、東芝データが統計処理して、企業向けに購買行動の把握や広告効果の検証をはじめとしたデータサービスに活用するとともに、集客などの効果測定の可視化につなげるというもの。

一方、会員はスマートフォンからいつでも購入履歴の確認・管理ができ、買い物における利便性の向上につながる現在の会員数は、190万人と200万人に手が届きそうな位置にあり、東芝データではデータの統計処理に加えて、データを収集・分析する必要があったのだ。

Databricks導入に向けた3つの要件

この記事は
Members+会員の方のみ御覧いただけます

ログイン/無料会員登録

会員サービスの詳細はこちら