多種多様な事業/サービスを展開するリクルートグループ。その中で活用されているAIの開発/運用を一手に引き受けているのが、リクルートテクノロジーズのITソリューション統括部 データテクノロジーラボ部でシニアマネジャーを務める石川 信行氏だ。
石川氏にAI/機械学習/ディープラーニングを活用する際に注意すべきことや、チームの作り方、必要なスキルや人材について話を伺った。
ビッグデータ活用の取り組みが自然と機械学習へ
――石川さんがAIを担当されることになった経緯を教えてください。
石川氏 : 新卒入社で9年目になりますが、最初はリクルート(当時)にIT採用自体がなく、私も総合職採用で入社しました。その後、2年目にITの部署に入り、出会ったのがHadoopです。
当時、弊社では軽いデータ解析は行っていたものの、大規模データの集計やレコメンドはやっておらず、「Hadoopでデータを貯めることで何かできないか」というレベルからスタートしました。
ただ、Hadoopは基盤でしかなく、データを貯めるだけでは意味がありません。サービスや事業に組み込んで、売り上げやコンバージョンなどのKPIにつなげていくことが当面の課題としてありました。
――ディープラーニングブームが来る前からデータを貯めて活用することに注目されていたのですね。
石川氏 : そうですね。Hadoopの構成要素の一つにHDFS(Hadoop Distributed File System)があり、このファイルシステムがあるからこそ画像もテキストも動画も音声も格納することができました。そうやって貯まったデータから機械学習を使って特徴を抽出しようとする試みを行っている最中に、世間的にも機械学習やディープラーニングブームがやってきたのです。
ブームが来たから機械学習やディープラーニングに取り組んだわけではなく、ビッグデータで進めてきたことの”地続き”として今があるかたちです。
――現在の石川さんの業務内容についても教えていただけますか。
石川氏 : ITソリューション統括部 データテクノロジーラボ部でシニアマネジャーをしています。組織づくりや戦略を立てるのが主な仕事ですね。
――部としての目標は?
石川氏 : 機械学習やディープラーニングを各事業に使ってもらい、リクルートのビジネスを成長させることです。そのために僕らが検証して、各部署に提案に行きます。
ネイル画像のタグ付けから始まった
――最初はどういった取り組みから?
石川氏 : 3、4年前にホットペッパービューティーのネイルの画像データが貯まってきたので、それをタグ付けするところからですね。とはいえ、事業としての筋道は最初はまったく立っていませんでした。
ただ、これで画像データが「使えそうだ」とわかりました。事例ができたことで、他の事業部からも機械学習やディープラーニングを使いたいという声が上がるようになったのです。
俯瞰して考えると、事業が違ってもモデルは同じなんですよ。ネイルのタグ付けだろうと。車種の判別だろうと、画像データとそのラベルを教師データとして使っているわけです。
それならインタフェースを共通化してしまえば効率もよいですよね。そんなわけで開発したのが機械学習/ディープラーニング活用のためのAPI「A3RT」です。
――A3RTは外部の方でも使えるのですか?
石川氏 : もちろんです。無料ということもあり、いろいろな使い方をしていただいているようです。現在、最も引きが強いのは日常会話のAPI、つまりボットですね。