IoT 時代を迎える今日、世の中に存在するあらゆるものが、日々、新たな情報を生み出しています。膨大で且つ形式が異なるデータの中からインサイトを得る。そのために、近年、データ活用の領域においては、いかにして適切にデータを管理するかが焦点を集めています。
世界 40 か国以上に拠点を構えグローバルにビジネスを展開するブラザー工業では、現在、「"あらゆるデータ" を "全てのユーザー" が有効に活用する環境」を掲げた次世代データ プラットフォームの構築を進めています。同社はこの実現に向けたファースト ステップとして、Microsoft Azure (以下、Azure) の下でデータ分析基盤を構築。着手からわずか 3 か月という短期間で用意された同環境は、初期構築のスピード感を維持しながら、次世代データ プラットフォームの実現に向けた発展を続けています。
部門を横断したデータ活用が企業の競争力を高める
プリンターの大手メーカーであるブラザー工業。同社は今、企業が持つあらゆる情報を集積した次世代データ プラットフォームの構築を進めています。「当社ではこれまで、各部門が独自にデータを活用してきました。ただ、それだけでは不足があると強く感じていました。」こう語るのは、同プロジェクトをリードするブラザー工業株式会社 IT戦略推進部 IT事業推進グループの大沼 春彦 氏です。
ブラザー工業では、企業としての競争力を高めるために、近年、先進テクノロジーを積極的に事業の中へ取り入れています。大沼 氏が所属する IT戦略推進部は、この旗振りを担う部門として、数年前から新しい技術による事業の強化に取り組んでいます。一体どのような理由で次世代データ プラットフォームの構築を進めているのでしょうか。
「開発部門は、製品のログ データなどを活用した次世代機の品質向上に取り組んでいます。品質管理部門も、製品ログと修理・コール情報をかけ合わせて、お客様の下で稼働しているプリンターの保守性向上を試みています。」大沼 氏がこう語る通り、ブラザー工業では既に、様々な部門で積極的にデータが活用されています。ただ、ここには、同氏が冒頭挙げた大きな課題がありました。
ブラザー工業株式会社 IT戦略推進部 IT事業推進グループの鈴木 禮奉 氏と大沼 氏は、このように説明します。
「各部門でデータ活用が進んでいることは喜ばしいことです。しかし、組織ごとに独自で分析基盤や BI ツールを用意しては、サイロ化が進んでしまいます。同じ情報を複数部門が重複して蓄積したり、ETL (Extract, Transform, Load) の仕組みが異なるために各部門の持つデータを組み合わせられなかったり、そういった無駄が生じてしまうのです」(鈴木 氏)。
「隣の組織が集めたデータや分析結果が自分たちの業務でも活用できる。サイロ化を解消すれば、こうしたシナジーが生まれます。データ活用が全社的に加速している今だからこそ、組織の垣根を無くすことで大きな力が得られるのです。こうした考えから、IT戦略推進部の重要な役割の 1 つとして、データ プラットフォームの構築を位置付けています」(大沼 氏)。
あらゆるデータ形式に対応させることが、次世代データ プラットフォームの条件
IT戦略推進部が進める試みでは、ブラザー工業が持つ "あらゆるデータ" を "全てのユーザー" が有効活用できる環境を構築することが目指されています。
鈴木 氏は、「市場競争は激しさを増すばかりです。事業を強くするために、1 日も早い次世代データ プラットフォームの実現を目指しています。」と述べます。そのために同取り組みでは、データ プラットフォームを新たに構築するのではなく、特定の部門で既に稼働しているデータ分析基盤をマイグレーションすることからプロジェクトをスタートさせたと語ります。
「0 から新しいサービスを生み出す場合、サービスがユーザーに浸透するまでにはどうしても長い期間を要します。既存サービスならば、マイグレーション後すぐにこれまで利用してきたユーザーが活用してくれます」(鈴木 氏)。
大沼 氏は、"有用だ" というユーザー体験が提供できればそれが部門横断的に活用を浸透させる原動力になると語り、ファースト ステップの対象にしたシステムについて説明します。
「マイグレーションの対象にしたのは主に品質管理部門が利用するデータ分析基盤です。ここでは業務部門が前日までの情報を翌日に利用できるよう、製品ログを日次で DWH (データ ウェアハウス) に集積しています。その転送データの件数は 1 日 2 億件を超えます。これまでは大手クラウド サービスとオンプレミス環境を併用することで何とか運用してきました」(大沼 氏)。
この環境の再構築にあたり、ブラザー工業は従来あった課題を抽出。次世代データ プラットフォームに発展させていくための設計について、ゼロ ベースで検討を進めました。
パートナーとしてこのプロジェクトに携わるアビームシステムズ株式会社 ソリューションビジネスユニットの大杉 佳誠 氏と深澤 拓摩 氏は、協議されたポイントを次のように説明します。
「プリンターの製品ログだけを見ても、データ形式は機種ごとで様々です。さらに、従来環境では工場内のデータやフィールド サポートの報告データも一部取り扱っていたため、構造化されているものとそうでないものが混在していました。こうしたデータの複雑性は、全社共通のデータ プラットフォームにしていく過程でいっそう強まっていくでしょう。実は以前の環境には、データの加工や集計に関わる課題が幾つかありました。これを踏まえた設計を採らなければ、ブラザー工業様の掲げる目標は達せられないと考えました」(深澤 氏)。
「従来環境では、SQL Server の SSIS (SQL Server Integration Services) で ETL の仕組みを構築し、オンプレミスでこれを稼働させていました。クラウドで全て完結させたかったのですが、オンプレミス環境でのデータ加工処理が多岐に渡り、ハイブリッド構成にせざるを得なかったのです。オンプレミスとクラウドの間では、毎日 2 億件ものデータをやり取りします。決して少なくないコストが転送料として発生しており、バッチ処理に毎日 10 時間以上を要していました。こうした理由から、クラウド上でデータの加工から集積まで完結させることを前提とし、最適な構成について検討しました」(大杉 氏)。
早期構築。データの集積と活用。どの観点でみても Azure が最適だった
どのような形式のデータも集積可能な DWH をクラウドに構築する。そのためにブラザー工業とアビームシステムズは、従来利用してきたクラウド サービスを含む大手 3 サービスを対象にした比較検討を実施。結果、Microsoft Azure (以下、Azure) を利用してプロジェクトを進めることを決定しました。
鈴木 氏は、「それまで利用していた DWH は SSISの実行に課題がありました。もう 1 社のビッグデータ解析プラットフォームは、処理性能は優れているものの他の 2 つと比べてサービス思想が全く異なっており、学習コストが多く必要になることが懸念されました。Azure は SQL Server との親和性が高いため、SSIS で構築した既存の仕組み、既存のスキル セットを活かすことができます。」と語り、Azure が最有力だったと説明。さらにこの他にも同社が Azure に期待したことがあったとし、大沼 氏とともにこう続けます。
「現状では、データの総容量はそれほど多くありません。ただ、将来的には当社の持つ全てのデータを集積していくこととなります。DWH に集められるデータ量は激増していくでしょう。そうした場合、DWH サービスの Azure SQL Data Warehouse には他社と比べた明らかな優位性がありました。多くの場合、DWH の総容量は二次曲線的に増加します。しかし、必要な処理性能も同様に高くなるかというとそうではありません。Azure SQL Data Warehouse ではコンピューティングとストレージとを分けてプランを組むことができるため、"必要な分だけ利用する" というクラウドの利点を双方に適用することが可能なのです」(大沼 氏)。
「ユーザーの増加に対して簡単に対応できる点も魅力でした。Azure Active Directory を利用すればユーザーの権限をすぐに設定できますし、ユーザーや部門単位で参照可能なデータを制御することも可能です。データの集積とデータの活用、双方の観点でみても、Azure は私たちが目指す次世代データ プラットフォームに適していました」(鈴木 氏)。
3 か月という短期間でマイグレーションを完了
ブラザー工業は Azure の採用を決定してからわずか 3 か月でマイグレーション作業を完了させています。大杉 氏は「既存の仕組みを活かして作業を進められたことが大きな理由でしょう。」と分析しますが、決してこれまでの仕組みを単純に Azure へ移したわけではありません。3 か月のわずかな期間の中、移行ではなく発展を伴ったマイグレーションとして環境を構築したのです。
大杉 氏と深澤 氏は、新たなデータ プラットフォームの設計に触れながらこのように説明します。
「今回、Azure Data Lake Analytics を利用して SSIS の仕組みをクラウド上に実装しました。このサービスは超並列のデータ変換処理プログラムを走らせるもので、U-SQL という SQL Server に限りなく近い環境で処理ロジックが開発できます。学習コストをかけず短期で SSIS の仕組みが移植できた他、処理性能の向上によって日次のバッチ処理に要する時間も大幅に短縮されています」(深澤 氏)。
「今後、集計加工のロジックはどんどん複雑化していくでしょう。Azure Data Factory ではここにあるジョブを容易に管理できるため、ジョブやプロセスが複雑化しても対応していくことができます。また、今後 Apache Spark ベースの Azure Databricks を利用すれば、転送データが肥大化したとしてもそこで必要な処理性能を確保することが可能です。Azure が備える各種サービスを活用することで、次世代データ プラットフォームへと発展させていける環境が用意できたと考えています」(大杉 氏)。
次世代データ プラットフォームの実現に向けて
この取り組みは、ユーザーが利用する分析環境にも変化をもたらしています。ユーザーはこれまで、BI サービスを通じて提供される定型レポートを参照する形でしかデータ分析基盤を活用することができませんでした。マイグレーションを通じてブラザー工業は、独自の軸からデータを自由分析できる新たな環境をユーザーへ提供しています。
鈴木 氏は、「データを 1 箇所に集めたとして、守らなければならない情報というのはどうしても存在します。Azure Active Directory では閲覧権限を制御することが可能なため、一般的に採られる DWH から自由分析用のデータ マートを切り出す作業が不要となります。これもあり、3 か月という限られた構築期間で自由分析の環境を用意することができました。」と語り、Azure が備えるサービスを高く評価しました。
大沼 氏は続けて、データの活用範囲を拡大したことによって、各部門から高い関心を得ていると述べます。そして、早くも部門を跨ってデータ プラットフォームが活用されていると語ります。
「品質管理部門にくわえ、マーケティング部門やサポート部門、開発部門が今回構築したデータ分析基盤を利用し始めています。活用する部門や集積対象のデータが増えれば、それだけデータ プラットフォームの持つ有用性が高まります。有用性が高まれば、新たなユーザーも増えていくでしょう。このようなサイクルによって、"あらゆるデータ" を "全てのユーザー" が有効活用できる環境を、早期に形成してまいります」(大沼 氏)。
ミシンの修理業からスタートしたブラザーは、プリンター、FAX、工作機械、燃料電池など、企業としての歴史を重ねるに連れて製品やソリューションの範囲も拡大してきました。多岐に渡る製品を世界中で提供する同社は、それぞれの製品、それぞれの拠点が持つデータを複合させることで、これまで以上に高い事業価値を市場に提供していくことでしょう。
[PR]提供:日本マイクロソフト