どれだけワクワクした世界を実現できるかを考えているATL

リクルートグループ各社の現在・将来のニーズを見据えて、競合優位性の高いIT・ネットマーケティング基盤を開拓、ビジネス実装しているリクルートテクノロジーズ。彼らは「リクナビ」や「SUUMO」といったウェブサービスの開発やインフラの構築、運用、そして様々なカスタマーの行動履歴といったビッグデータのデータサイエンスなどを手がけている。

その中でも、先進技術のR&D(Research and development)を行っている研究開発機関がATL(Advanced Technology Lab)だ。グループ全体で次世代をリードするための、という目的だけではなく、「どれだけワクワクした世界を実現できるか」も視野に入れているのが特徴だ。

他の事業会社もそれぞれR&Dを行っているが、ATLが手がけている分野は脳波インターフェースなど、すぐには実用化できるか分からないが、将来的に事業化できるかもしれないといった技術を追いかけている。中にはものにならない技術もあるかもしれない。しかし先乗りすることで、いざそれが流行った時に一歩も二歩も先んじられることを目的としている。

研究開発テーマはメンバーが自ら見つけてきた課題が中心だ。これは面白そうだとか、これを研究してみたいといった情報が起点となり、将来性やビジネスとの相性が加味され、実施するかどうかの判断が下される。研究開発中のテーマに関しても、定期的に続行するか停止するかのスクリーニングを行っている。

オフィス外のネットワーク、コミュニティや勉強会で得た最新テーマに可能性があるならばR&Dをサポートするという、エンジニアファーストな企業文化が見えてくる。

現在注力している自然言語処理

人間が日常的に使っている言語をコンピュータで処理、解析するのが、ATLが注目する「自然言語処理」と呼ばれる技術だ。

これまでにリクルートテクノロジーズにおいては、自動で文書を校正してくれるツール『RedPen』や、会話を投げかけると様々な会話が返ってくるLINEのBOT『パン田一郎』の“裏側”のロジックなど、様々なサービスを開発・提供してきた。

元々ビッグデータ関連の部署では、レコメンドのために何かできないかという視点で研究を行っていたものの、ATLにおいて本格的な研究が始まったのは、2013年の秋にデータマイニング系を研究していた伊藤氏が入社した頃だという。

伊藤氏は語る。

リクルートテクノロジーズ ITソリューション統括部アドバンスドテクノロジーラボ 伊藤敬彦氏

「自然言語処理はすでに色々なサービスとして使われています。一番有名なのは検索エンジンの検索候補表示機能とか、Google IMEですね」

しかしGoogle IMEのような一部の例外を除くと、自然言語処理やデータマイニングの技術は各種サービスのバックエンドに採用されることが多く、エンジニア以外の人が利用するようなアプリケーションがなかなか存在しなかった。

「現在私が開発している自動文書検査ツールRedPenは非エンジニアも対象としたサービスで、誰でも利用することができます。また、オープンソースプロジェクトなので、自然言語処理を研究している人が簡単に機能追加できるような設定になっています。もともと何かのサービスの内部アルゴリズムを作るだけではなくて、非エンジニアの人までワンアプリケーションとして届けることを1回やってみたいな、と思っていましたし、自然言語処理研究者が社会にアウトプットしやすいようなプラットフォームがあったら嬉しいのかな、という考えがあったんですよ」

リクルートが自然言語処理を研究する意義について、広報の櫻井氏は以下のように語った

「ロジックやアルゴリズムを研究するだけで世の中をあっと驚かせることができるかどうかは、まだわかりません。しかしリクルートには様々な事業というアセットがあるので、ベーシックな技術を蓄え、ビジネスと組み合わせて実用化することで、サービスとして化ける可能性はあると思っています」

効率よくフォーマッティブなテキストを作る技術

日記や文学作品とは異なり、誰が読んでも同じ情報が得られるように構築すべき技術書や仕様書といった文書の自動検査ツールがRedPenだ。一般的な文書はプログラミングに比べ、自動校正ツールが用意されていない上、題材に応じて適切な表記方法が視覚化されていないためにスキル取得が難しい。

「研究論文を書いているときやベンダで働いている時に中々文章の精度が上がらないというのが悩みでした。あたりまえのフォーマットレベルの問題に対して体力が削られてしまい、内容の構成とか段落構成なんかに手が回らないという課題があって、フォーマット異常をチェックしてくれるツールがあったらいいな、自然言語で書いたら面白いかな、というか、僕が使いたいなと思っていたんですね」(伊藤氏)

RedPenについて語る伊藤氏

そして伊藤氏が作り上げたのがRedPenだ。「完全に趣味のプロダクト」とはいうが、雑誌の記事や書籍においても長い文章を書いてくると句読点のズレや、表記ブレが発生しやすい。これらの校正ポイントを自動判別して「どの文章作成者が書いても同じ規約の元に書けるようになったらいいなと思って作っている」そうだ。

「自然言語処理のところでいくと、プリミティブな開発であっても実際のプロダクトを作る中で気づくポイントが出てきます。そういった要素技術のロジックを理解することで、他の分析のツールを作る時などに伊藤の知見が生きてきます。ATLの目的には大きく2つあります。1つは先端技術を研究・開発して事業に実装していく、先んじて実装していくということ。もう1つは「リクルート×IT」としてのプレゼンスを上げるというところ。リクルートが「ITで勝つ」ということを標榜しているいま、テクノロジーで勝つためには、こういった尖がった人間も含めて、優秀なエンジニアさんがいっぱい欲しいんですね」(櫻井氏)

実際にエンジニアのメンバーが自然言語処理学会のイベントなどに出席して、自分たちの自然言語処理技術周りの開発結果を発表してくると、「リクルートって、こんな実直な開発をしているんだ」ということが伝わる。「エンジニアがエンジニアを呼ぶ」(櫻井氏)のも彼らのミッションであるという。

膨大な会話データベースを生み出すユーザー参加型人工無能開発

リクルートテクノロジーズ ITソリューション統括部アドバンスドテクノロジーラボ 大杉直也氏

フロム・エー(リクルートジョブズ)のイメージキャラクター「パン田一郎」がLINEでアカウントを開設してからというもの、送ったメッセージに対するレスポンスが秀逸、あまりにもボキャブラリーが多すぎるということで大人気に。今や1,200万人がパン田一郎を友達として登録している。

「既存のLINEビジネスコネクト(公式アカウント)って話しかけても、あまり面白くないものが多かったんですね。一部の言葉には反応するんですけど、それ以外には『おはよう』『こんにちは』『さよなら』くらいしか辞書に入っていないみたいな。だからせっかくLINEビジネスコネクトでやるんだったら、もう話題になるものに仕立てようという話になって、すごい量のテキストを用意するっていう方向から始まり、今なお増え続けてます」(大杉氏)

ただし、ユーザーがどういう言葉を入力することが多いかはエンジニアリングでわかるものの、面白いレスポンスの内容に関しては作家性が必要になってくる。

そこで大杉氏が現在開発している『脳内カレシ具現化計画(脳カレ)』は、テキストの作成を大学生や主婦など、一般参加の方に依頼している。

「面白い文章というデータがあった時に、それを面白い見せ方にしたりとか、面白いコンテンツに押し込んだりするところがエンジニアの仕事」という大杉氏は、「パン田一郎のロジック開発を通じて色々なファインディングがありまして。この知見をパン田一郎以外のキャラクターにも応用できるかもしれないと考えました。例えばテンプレートさえ用意すれば、誰でもキャラクターを作れるのではないかと。しかも、返答パターンのアルゴリズムを複雑にすることで、パン田一郎を超えた応答が可能になるかもしれないと。そんなコンテンツを生成するためのツール群を考案し、ある意味実証実験的に開発しています。」と語る。

自然言語処理について説明

例えば奥さんに何か食べたいっていったら気の利いたものを作ってくれるとか、今日の夕飯5人予約したいんだけど、適当に店選んでおいてといったら予約完了といったことが可能になるかもしれない。その取組みには「新しい技術が必要になってくるかもしれませんが、そういった点を狙っていきたいですね」と大杉氏は実現に向けた意欲を見せる。自然言語処理技術が作り出す未来はホスピタリティ重視の空気を読む新たなIT社会なのかもしれない。