2026 年に創業 100 周年を迎える総合出版社の集英社が、社内外のさまざまなデータを収集し分析するためのデータ分析基盤を構築しました。出版業界では、デジタル化やメディアミックスが進む中で、紙の雑誌やコミックの販売から、アニメや映画、イベントなど、コンテンツを中心にした事業に領域が拡大しています。そんななかで「作品力」を知るためのデータ分析基盤が必要になったといいます。Azure Synapse Analytics と Microsoft Power BI、Microsoft Purview を用いて「現場中心」のデータ活用を推進する集英社の取り組みを聞きました。
デジタル化とメディアミックスが進むなか、「作品力」を知るためのデータ分析基盤が重要に
1926 年の創業以来、『週刊少年ジャンプ』『週刊プレイボーイ』『non-no』などの漫画、ジャーナル、ファッションなどの雑誌をはじめ、コミックス、文芸書、文庫、新書、美術書、写真集、辞・事典まで多種多様な分野で出版事業を展開した総合出版社の集英社。近年では、デジタル出版やアニメ、映画、グッズ、イベント、海外展開など、コンテンツ(IP)を中心に事業領域を拡大させ、2026 年に迎える創業 100 周年に向けて、会社の社是である「創意」「自信」「協調」のもと、「人が夢中になれるようなコンテンツやサービスの創出」に取り組んでいます。
モノやサービスのデジタル化が加速するなか、出版という紙ベースの事業のあり方は大きく変化しています。ただ、社内での意思疎通や販売実績の把握、書店や取次とのやりとりなどは、従来から紙ベースの業務が多く残り、時代の変化に対応しにくくなっていたといいます。情報システム部 情報マネジメント室 係長 須藤 明洋 氏は、こう話します。
「例えば、『鬼滅の刃』『SPY×FAMILY』といった作品ごとに売上を把握したいとき、紙の雑誌や書籍の場合は、書店や取次から提供される販売データを見れば傾向をつかむことができました。しかし、デジタルになると、アプリでの 1 話単位での販売や、コインやポイントでの販売、オンライン書店ごとの無料公開キャンペーンなど、参考にすべき指標が紙の時代とは比較にならないほど多様化しています。アニメ放送やコンビニなどでのグッズ展開をきっかけに売上が急伸することもあります。販売データだけを指標に重版のタイミングや部数を判断することは難しくなっていました。また、オンライン書店やアプリ、グッズ、アニメ、イベント開催などに関するデータを知ろうとしても、データが膨大で整理されていないのですぐに把握できない状態でした。『あれ初速どうだったの』と編集者から聞かれても、販売として答えられないことが増えていました」(須藤 氏)。
データ量の増大や多様化といった課題に対しては、10 数年前から課題意識があったといいます。編集部、販売部、オンライン担当などが連携してデータの集約や共有を図ろうとしていましたが、デジタル領域の展開が進むにつれてデータはさらに多様化し、やりとりや整理がさらに煩雑になっていきました。
「編集者は自分が担当する作品の作品力を知りたいわけです。作品力を知るために、これまでは指標として主に紙の販売データを使っていました。ただ、デジタル化やメディアミックスが進むと、作品力を知るための指標が多岐にわたり、データをどう見て判断すればいいかがわからなくなります。そこで多種多様なデータを分析して共有するための基盤が重要になっていました」(須藤 氏)。
そんななか集英社は、データ分析基盤を約 1 年かけて構築し、2022 年 5 月から運用を開始します。このデータ分析基盤に採用されたのが Microsoft Azure(以下、Azure)でした。
編集者や社外とのやりとりが多い販売部が中心となって、Azure を基盤に据えることを決定
Azure を使ったデータ分析基盤の構築に取り組むきっかけとなったのは、2020 年から本格化していた在宅勤務だったといいます。在宅勤務は、働き方改革などに対応する取り組みとしてスタートしたもので、コミュニケーションツールとして Microsoft 365 の全社導入を進めていました。
「Microsoft 365 の全社導入を済ませたタイミングでコロナ禍が発生したのですが、Microsoft Teams などを使って普段の業務もスムーズにこなすことができました。当時私はコミック販売部に所属していて、Microsoft 365 を使って編集部との販売データのやりとりを行っていました。そのときに、Microsoft Power Platform(以下、Power Platform)というローコードで業務変化を起こせるツールが備わっていることを知ります。それまでデータの加工やレポートは Microsoft Excel(以下、Excel)を使っていたのですが、Microsoft Power BI(以下、Power BI)を使うと、集計や分析が容易になり、編集者にデータを見せる際も効率良くできます。そこで、Power BI を活用するためのデータを集約できる基盤を作ろうと社内に提案しはじめたのです」(須藤 氏)。
在宅勤務によりオンライン環境での仕事が増えると、データを集約して共有できる基盤を作りたいというニーズは急速に高まりました。また、取引先などからも必要性を訴える声や具体的な提案も増えてきていました。ただ、効率的に実現する手段や推進する担当者がいないことから、取り組みがなかなか前進しませんでした。そんななか、販売部で業務のニーズを知る須藤 氏が率先して働きかけを行ったことで、データ分析基盤構築の流れが一気に進むことになったのです。
「Azure を採用したのは、Microsoft 365 や Power BI、Azure Active Directory(AAD)を活用しやすいクラウド基盤だったこと、協力会社や情報システム部門に知見やノウハウがあったことが大きいです。他部署で使っていた BI 専業ベンダーのツールや他のパブリッククラウドを導入する案もあったのですが、ライセンスコストや運用コストの観点から マイクロソフト製品に統一するほうがよいと判断しました。個人的にも、Power Platform に統合される前からワークフローツールの Microsoft Flow を使っていたこともあり、取り組みを進めやすいと感じていました」(須藤 氏)。
須藤 氏は、販売部に所属しながら、情報システム部門と連携して、社内で利用する業務システムの改修や Web システムの立ち上げ、ワークフローの改善などを現場レベルで支援する役割を担ってきました。
「父親も PC 関係が好きで、IT やシステムには昔から馴染みがありました。データを分析したり、社内に働きかけを行ったりすることも好きなほうです。タイミング良く経営層の理解も得られたため、販売部が中心となって Azure を使った全社データ分析基盤を作ることになりました」(須藤 氏)。
Synapse と Power BI でデータを見える化、データの民主化に向けて Purview でカタログ化も実現
もっとも、販売部中心でシステム構築に取り組もうとしても、システムやプロジェクトマネジメントに対する知識や経験は圧倒的に不足していたといいます。
「IT ベンダーや開発パートナーの方が何を言っているかわからなければ、実現したい要件や価格、納期などを正しく伝えられません。対等に議論するための知識を身につけなければ話にもならないと考え、時間をつくってひたすら勉強しました。幸いなことにマイクロソフト製品は、ドキュメントが豊富で、認定資格も充実しています。Power BI の認定資格『Microsoft Power BI Data Analyst(PL-300)』など数種類の資格を取得したことで、プロジェクトの関係者と対等に話ができるようになりました」(須藤 氏)。
データ分析基盤は、データの蓄積場所として Azure Blob Storage を、データウェアハウス(DWH)として Azure Synapse Analytics を採用し、DWH に Power BI からアクセスして、定型レポートや個別の分析レポートを担当者が閲覧するという構成です。データソースとしては現在、販売部が管理してきた雑誌・書籍・コミックスの売上データや在庫・入出庫データに加え、デジタルコンテンツの売上データ、商品マスタ、書店マスタ、編集部マスタなどが蓄積されています。
須藤 氏とともにデータ分析基盤の活用と社内展開を推進してきた、コミック販売部の五十嵐 拓嵩 氏はこう話します。
「販売データを中心にデータを蓄積していて、今後は、店頭での購買層や、販促活動の履歴などのデータなどを蓄積し活用していきたいと考えています。その一方でデータがさまざまな箇所・形式で使われていて、すべてを一箇所に集めて分析できるようになるまでには時間がかかります」(五十嵐 氏)。
須藤 氏はこのように続けます。「従来からの紙の販売データについては、長い歴史もあり、業界としてデータを標準化してやりとりするための体系的なシステムもあります。ただ、デジタルデータについては、オンライン書店、オンライン取次、イベント、アニメ、映画、グッズなど、フォーマットや取得するデータ項目もバラバラです。これらをどう統合していくかはこれからの課題です。データの標準化ややりとりするためのプロトコルなど、取り組んでいかなければならないことが多いです」(須藤 氏)。
こうした課題への対応やデータの民主化を進めるために、基盤が稼働した後には、多種多様なデータをカタログ化し、適切にマネジメントしていくことを目指して Microsoft Purview(以下、Purview)の利用を開始しました。
「Purview を使うことで、どのデータがどこで作成され、誰が管理しているかを画面上ですばやく把握することができます。データ分析基盤を全社的に展開し全員がデータを共有していくうえで重要な機能です」(須藤 氏)。
データを一箇所に集め共有したことで、業務効率が上がり、データ活用の可能性が拡大
Azure を活用したデータ分析基盤を構築したことで、さまざまな効果が現れはじめているといいます。
まずは、データを一箇所に集約したことで、データの提供スピードが上がり、関係者全員が共通のデータを見て議論できるようになりました。
「同じデータを同じタイミングで見ることができるというのは、地味ですが非常に重要です。これまでは編集部員がデータを知りたいときは、販売部に販売データの確認をし、販売部がデータを必要なところから集めてきて Excel にまとめて編集部にメールで提供したり、Excel データをクラウドストレージにアップロードしてアクセスしてもらったりしていました。今は、基本的な販売データは Power BI のレポートとして提供していますので、誰もが好きなタイミングで好きなデバイスで見ることができます。みんなが少しずつ抱えていたデータを見るためのストレスがなくなり、すぐにデータをもとにした議論ができるようになっています」(須藤 氏)。
業務負荷の軽減という点でも大きな効果を確認しています。データ提供のためにはデータを収集して加工する作業が必要です。その多くがなくなったといいます。
「データ提供の依頼は編集部や経営幹部などの社内からだけでなく、アニメ化やグッズ展開、イベント開催などにともなってさまざまな取引先からも求められます。以前は、その度にデータを集めて作り直したりするため、ほぼ毎日データにまつわる作業をしているところがありました。今では、データの加工が必要になっても、Power BI で簡単にレポートを作り直せますし、編集部員や取引先などに提供することも素早く簡単にできます」(五十嵐 氏)。
また、複数のデータを掛け合わせて把握できるようになったことで新しい取り組みがしやすくなっているといいます。
「紙の販売データだけでなく、デジタルの販売データを組み合わせて見ることができるようになりました。『紙よりもデジタルのほうが売れている』など、さまざまな視点で作品力を知ることができます。現状ではデジタル販売のデータは、オンライン書店の 1 冊単位での販売データが対象ですが、これから、Web サイトやアプリ、アニメ、映画、イベントなど多種多様な形式のデータに対応していく計画です。また今後は『何百万部突破』といった販売実績だけではなく『アプリ内での読了率や継続率』などの指標が重要になるシーンも増えてくるはずです。さまざまデータを組み合わせることで、作品に対する新しい視点を提供していきたいと思っています」(須藤 氏)。
「ビジネス部門が自由にデータを使うことのできる環境」を目指す
デジタルやメディアミックスの展開が進む中、取り扱うデータの種類や量はますます広がっていきます。そんななかで、Azure Synapse Analytics(以下、Synapse)や Purview への期待は大きくなっています。
「Synapse の良さは、根幹となるアーキテクチャを変更せずに、さまざまなデータソースに対応できることです。データソースが増えると、ETL ツールの設定や新しいクエリーを追加していく必要がありますが、Synapse の場合、その都度システムを更新する必要がなく簡単に設定やデータソースを追加していくことができます。また、Purview を利用すると、みんながデータを活用したいと思ったときに『誰に言えばいいかわからない』といった状態をなくすことができます。生データに直接アクセスさせずにデータカタログだけを公開し、社内で共有が可能です。データが増えていったときも管理が容易で『個人情報だから取り扱いに注意』といったことをシステム側からアラートしてくれます。まだ使いはじめたばかりなのですが、最初から『求めていたのはこれだよ』と納得して使うことができています」(須藤 氏)。
須藤 氏によると、集英社のデータ分析基盤で目指しているのは「ビジネス部門が自由にデータを使うことのできる環境」です。
「IT 部門が中央集権的にデータを管理するのではなく、データを使いたい人が使いたいときに自由に安全に使える環境を作りたいと考えています。データ分析基盤の構築を終えたあと、販売部から情報システム部 情報マネジメント室に異動しましたが、情報マネジメント室で取り組んでいるのも、そうした全社的な情報のマネジメントです。データソースが増えたときに Synapse によってアーキテクチャを変えずに対応しつつ、新たにデータが生成されたときも Purview で自動的にデータをスキャンしガバナンスやコンプライアンスが効いた状態で管理できるようになります。その意味で、この 2 つのサービスには大いに期待しているところです」(須藤 氏)。
須藤 氏の異動後は、販売部におけるシステム推進やデータ活用の業務を五十嵐 氏が引き継いで実施しています。新たな取り組みとして、需要予測などにも取り組んでいます。
「Synapse に格納されている日々の入出庫データをもとに、重版する部数を効率良く判断できないか検証しています。コミックの重版部数は、販売部の担当者が分担して 1 点ごとに部数の見積もりを行います。コミックスは数千点のラインナップがありますから、販売部員 5 ~ 6 人が分担しても 1 人あたり 1000 点超を担当することになります。1000 点の販売データを収集して紙にプリントし見ていくだけでも 2 ~ 3 日かかることがあります。そこで、Synapse のデータを分析し、重版する部数の予測を帳票上に表示できるようにしたいと考えています。Power BI のダッシュボードへの組み込みも簡単で、今後、予測数字を見ながら、効率良く部数の判断ができるようにしていくという目標もあります。将来的にはさらにデータ分析の際に Azure Machine Learning などを活用することも視野にいれています」(五十嵐 氏)。
須藤 氏はデータ活用を現場がリードすることで、実際の業務により沿った取り組みをスピーディーに効率よく実施できるといいます。販売の現場から IT の現場に移った須藤 氏はデータマネジメントの観点から、取り組みを高度化させていくことになります。「ビジネス部門が自由にデータを使うことのできる環境」の実現に向けて、集英社のデータ分析基盤構築の取り組みはさらに加速していきます。
[PR]提供:日本マイクロソフト