企業や組織で活躍するデータサイエンティストの方々に、さまざまな質問をぶつけて「データサイエンティストの真の姿」に迫る本連載。今回は、オンライン英会話サービスを展開するレアジョブで、データサイエンティストとして活躍している山本隼汰氏に話を聞いた。
インターンとして機械学習エンジニアを経験
山本氏は大学で統計学を専攻しており、学生時代から統計に関わっていたそうだ。「初めてデータ分析がおもしろいと感じたのは、選挙の当選確実の速報です。その統計の仕組みは実にシンプルなものです」と同氏は語る。
選挙が終わると、数時間で「〇〇党の〇〇氏に当確が出ました」という報道が流れるが、「なぜ、開票率がたった1%にもかかわらず、当選が確実だとわかるのか」と思っている人も多いだろう。この当確には、統計が深く関わっている。
こうして統計への興味を深めた山本氏は休学して、会計クラウドサービスを提供しているfreeeでインターンを開始した。freeeでは、インサイドセールスや勘定科目のエンジンの開発に携わり、インサイドセールスを担当している時は、ユーザーのログインやメールの開封に関するレポートを作成して、分析を行っていたそうだ。
「もともと会計学の知識があったことが、freeeで働く上で役に立ちました」と山本氏。エンジニアとして働くとしても、自社のサービスに関する知識に精通しているに越したことはない。
新サービスのローンチでデータを使ったビジネスを具現化
さらに、山本氏は自身の幅をもっと広げたいという思いから、スタートアップに移った後、レアジョブに入社した。現在は、研究開発を担当する「レアジョブEdTech Lab」に属している。同プロジェクトでは、同社が十数年で蓄積してきたレッスンデータをもとに分析・研究、プロトタイプとなるプロダクト開発に従事している。
freeeでは学生時代に学んでいた会計学が役立ったと前述したが、山本氏はもともとレアジョブの英会話サービスを使っていた。そんな同氏は「データサイエンティストにとって、業務知識が重要です。というのも、業務知識があることで、自社のビジネスにおいてデータがどう生成されているかということをイメージできるからです」と語る。
例えば、英会話サービスの場合、定期的にレッスンを受講できず、レッスンがたまってしまうこともある。そんなユーザーについて、「どういう状況で、レッスンがたまってしまうのか」「デバイスはどうなっているのか」など、さまざまな状況を分析して、レッスンがたまってしまうという状況を解消していく必要がある。「自社のサービスに精通していれば、分析の初手がよくなります」と、山本氏は話す。
しかし、「データを分析していると、バイアスがかかってしまう。だからこそ、データに思いをはせることで、正確なデータ分析に導いていくのです」と山本氏。「データに対する想い」は、データサイエンティストに求められる素養の1つと言えそうだ。
そして、同社は今年6月、AIで自動採点を実現した英語スピーキング力測定システム「PROGOS」をリリースしたが、山本氏はサービスのメインとなる音声認識や自然言語処理をはじめとするAIエンジンの開発を担当した。「PROGOSによって、データを使って、サービスができることを示すことができました。これからも継続して、データを使ってできることを体現していきます」と、同氏はいう。
データサイエンティストは分析力を持っていて当たり前
さて、取材中に何度も山本氏の口から出てきたのは「ビジネスのドメイン知識を知っていることが重要」という言葉だ。同氏はAIを学ぶスクールで講師をしていた時、技術にしか興味がない受講生がいたが、「技術だけを知っていても意味がありません。まずは、ユーザーがどこに課題を感じているかを理解するためのインサイトが重要です」と指摘する。
さらに、山本氏はこう続けた。「例えば、われわれはお医者さんに技術を求めません。なぜなら、『医者は医療技術を持っていて当たり前』という観念があるからです。お医者さんは『カウンセリングがすぐれている』『説明がわかりやすい』といったことが評価されるケースが多くないでしょうか。データサイエンティストも同じです。データサイエンティストは分析ができて当たり前です。これからのデータサイエンティストはお医者さんと同様に、『開発力がすぐれている』『コンサルティングがうまい』といったことが評価されていくのではないでしょうか」
また、これからデータサイエンティストを目指す人に対しては、「技術力だけで、先駆者に勝つことは難しい。だからこそ、自分が持っている知識をベースに、どこで活躍できるかを考える必要があると思います。技術は後からでも習得することができます」と話す。
さらに、山本氏は「小さなサービスを作っていくことが大事です」とも話す。なぜなら、研究開発の分野では「死の谷」「魔の川」という言葉があるが、ビジネスの種が見つかっても、それが大きくならずに淘汰されていくことが少なくない。つまり、「成果が出ない」という状況が続くことがないよう、自分の考えたことをビジネスにつなげて具現化していくことが重要というわけだ。
会社は基本、業績を上げてこそ、存在価値があるわけで、いつまでも実にならない事業を甘やかしてはくれないだろう。データがビジネスで有効であることを示すには、やはり自社のサービスやソリューションにつなげていかなければならない。
山本氏に、今後の展望について聞いてみたところ、「データを切り口として、事業に貢献していきたい」という答えが返ってきた。データを組み合わせることで、どうビジネスをドライブしていきたいかを追求していきたいという。同氏が目指すデータサイエンスは、あくまでもビジネスに寄り添ったものというわけだ。
「PROGOS」をリリースしたことで新たにデータが生成されることになるが、それらをどう生かしていくかも、山本氏の次の課題となるだろう。まだまだ同氏のデータを活用した挑戦は続いていく。