NTTドコモと電話放送局は11月7日、電話の自動音声応答(IVR)向け対話システムを構築したことを発表した。

同システムは電話放送局のIVRシステムとドコモの対話ボット自動構築技術を組み合わせることで実現。電話放送局のIVRシステムは独自開発のミドルウェアを利用することで、基幹システムをはじめとした多様なシステムとの連携が可能となり、業界最大規模4500回線の電話インフラで、クラウド型のサービスとして提供している。また、対話ボット構築技術は、代表的な質問と応答のペアを用意するだけで、ユーザーと複数回の対話が可能となる対話ボットを自動的に構築する、ドコモ独自開発の自然言語処理技術。自動構築された対話ボットは、単なる1回の対話だけでなく、ユーザーの質問に不明点があった場合には、ユーザとの間で複数回の対話を行い、最終的により良い応答をすることが可能だという。

これらの技術を活用し、同システムでは、IVRシステムが電話をかけてきたユーザーと対話ボットとを接続することで、電話を介した音声対話を実現する。

システムの概要

動作としては、まず、電話を介して発話されたユーザの質問をIVRシステムが音声認識機能によってテキストに変換。その後、対話ボットに出力し、対話ボットは入力されたテキストに対して、あらかじめ用意された対話データに従って適切な回答を生成し出力する。さらに、IVRシステムが、出力された回答を音声に変換し、電話を介してユーザに伝え、ユーザーが受け取った音声の回答を基に次の質問を発話することで、対話が継続していくという仕組みだ。