「ビッグデータ時代」と言われる現在、企業はどのようにデータを収集し、どのようにビジネスへ活用していくべきだろうか。マイナビが9月12日(金)にパレスサイドビル(東京・竹橋)で開催する、企業のHadoop活用をテーマとしたイベント「マイナビニュースITサミット - ビッグデータ活用を支えるHadoopセミナー」で基調講演を行うヤフーは、Hadoopを活用したビックデータの解析結果をサービス改善や売上拡大に役立てている。
カギを握る「データソリューション本部」の役割
検索をはじめ、ニュースやショッピング、決済など100を超えるサービスを提供しているヤフーでは、各サービスで収集するデータを同社データソリューション本部が一元的に解析・分析を行っている。
同部門ではかつて、データの解析・分析に独自のシステムを利用していたが、スケーラビリティの課題が顕在化した2008年にHadoopへ全社的に刷新した。現在は4000台規模のHadoopクラスタを構築し、データの解析・分析に活用している。
「スマートデバイスの登場で、それぞれのサービスが収集するデータ量は飛躍的に増加しました。さらに一つの画面の中で、ユーザーが何を見て、どのような動きをしたのかといったログ単位のデータ粒度も細かくなっています。このようなデータをサービスの改善や新規サービスの立ち上げに役立てるよう、データソリューション本部がデータの解析・分析のインフラを各サービスの事業部門に提供しています」と、同本部データソリューション本部テクニカルディレクターの角田直行氏は、ヤフーのサービスにおけるデータソリューション本部の役割を説明する。
ヤフーではこのようにして収集されたデータを解析・分析することによって、具体的なサービスの改善に活用しているという。
些細な改善であっても、大きな差が生じるケースもある。例えばデータの解析結果をもとにスマートフォン用トップページにある検索フォームの見せ方を少し変更しただけで、年間5億円もの売上増加につながった。
角田氏は、「各サービスが収集したデータは、ヤフーにとって貴重な財産です」としているが、同本部 TD室 室長 日比野哲也氏も、「ヤフーはHadoop以前から広告や検索などでビッグデータを活用していましたが、システムは手組みで構築していました。Hadoopはビッグデータの汎用的なプラットフォームということができ、そこに乗ることで個別にシステムを構築するよりも開発スピード、コスト面でのメリットがあります」とビッグデータ活用におけるHadoopの有用性を指摘している。
角田氏と日比野氏の両氏は「マイナビニュースITサミット - ビッグデータ活用を支えるHadoopセミナー」において、自社のHadoop活用について、さらに詳しく紹介するセッションを行う予定だ。ヤフーにおけるビッグデータ活用の先進事例は、多くの企業にとってデータ活用の大きなヒントとなるに違いない。