インターネット上に大量の情報が溢れる昨今、ユーザーは自分にとってより適したコンテンツや潜在的に興味のある情報に出会うことが難しくなってきている。そのため、コンテンツを提供する側としては、精度が高いレコメンデーションを用い、ユーザーのニーズに寄り添ったコンテンツを提供することが重要となる。

2015年、ヤフーはYahoo! JAPANアプリおよびスマートフォン版トップページをタイムラインUIへと刷新。限られたスマートフォンの画面表示領域を有効に活用するために、ページ下部のタイムライン部分において、ヤフーの持つビッグデータと人工知能(AI)技術を活用し、各ユーザーの興味関心に合わせて記事や動画などのコンテンツを編成するしくみを採用した。

本稿では、Yahoo! JAPANアプリにおいてコンテンツレコメンドのロジック開発に携わってきた ヤフー メディアカンパニーのデータサイエンティスト 大倉俊平氏に詳しくお話を伺った。

RNNを採用したことでレコメンドの精度が向上

Yahoo! JAPANのトップページ改修前にもレコメンド機能は実装されていたが、PCのみでの表示だったため、活用しているユーザーは今の規模と比べると、あまり多くなかったという。そこで、アプリおよびスマートフォン版を刷新するにあたり、このレコメンドシステムの精度をチューニングしていく方針となった。

「当時は、形態素解析で『サッカー』という単語が入ってる記事を読んでいる人にはサッカーに関する記事を出す、というように単語レベルのマッチングの度合いでユーザーの興味を判断していました。ただしこの場合、『あなた』などの代名詞や『東京』という地名など、あまりに対象が広い単語はレコメンドにおいて役に立ちません。またサッカーの記事でも、『サッカー』という単語を用いずに書かれているものもありますよね。単語のみで判断しているとこうした記事を取り逃がしている可能性もあります。そこで、より精度のよいレコメンドシステムを構築しようということになりました」(大倉氏)

レコメンドシステムの改修にあたっては、学習モデルとして機械翻訳などに用いられるRNN(再帰型ニューラルネットワーク)を採用した。RNNは、ニューラルネットワークのなかでもある時間の経過とともに値が変化していくような時系列データを扱うことができるもので、"文脈"を考慮した学習が可能であるとされている。

  • RNNによるモデル学習のイメージ(画像提供:ヤフー)

    RNNによるモデル学習のイメージ(画像提供:ヤフー)

大倉氏は「単語を順に入力していくことで、一番最後に意味を成すベクトルができます。ユーザーの閲覧履歴についても同じように、順に入力していくことでユーザーの好みがベクトル化されて出力されるというイメージです」と説明する。

改修後のレコメンドシステムでは、たとえば、一定期間のうちにサッカーに関する記事をどれくらいの割合で閲覧していたかで興味度合いを図ったうえで、閲覧のタイミングなども考慮することにより、ユーザーに適したタイミングで興味のあるサッカーの記事を表示できるという仕組みになっている。改修の結果、ユーザーの滞在時間は大幅に延びたという。

さらに「改修によってユーザーの興味と関係なさそうなコンテンツをより精度よく除外できるようになったのではないかと考えています」と大倉氏。

「たとえば、災害が起こったら自分の普段の興味とは関係なく災害関連のニュースをみますよね。こうして一時的にあるテーマに関する記事の閲覧数が増えたとしても、それを興味のあるものと判断しないようになったことも、改修の成果であると思っています」と改修の効果について振り返る。

  • RNNを活用した最新のレコメンド機能のイメージ(画像提供:ヤフー)

    RNNを活用した最新のレコメンド機能のイメージ(画像提供:ヤフー)