NTTレゾナントは11月8日、マルチモーダルAI技術などと連携可能な機能を持つAPI群「AI suite」の提供を開始すると発表した。同サービスはテキスト情報の解析に加えて、音声や映像情報の解析を可能にするマルチモーダルAI技術などと連携可能なAPI群だ。「AI suite」内のAPIと組み合わせることで、AIサービスをスピーディに構築可能になるという。
テキスト情報や、音声および映像情報など複数の入力情報を活用するマルチモーダルAIは、同社の自然言語処理技術と、NTTコンピュータ&データサイエンス研究所が持つ音声・映像認識技術を統合して開発したものだという。この技術によって、声の調子や表情、身振りからユーザーの属性や感情をAIが予測して、自然な受け答えが可能になる。
また、提供するAPI群は高度な言語解析技術に強みを持っており、複数回の受け答えで会話の文脈を理解して、ユーザーの意図を踏まえ的を射た応答を実現するという。会話の中から日時や場所、価格といった要素を抽出できるため、AIによる自動受付システムとの連携にも活用可能だ。
さらに、今回提供するAPIはWebブラウザだけでなく、LINE、Twitter、スマートフォン向けアプリ、AR、VRなど、幅広いプラットフォームでの連携に対応している。サーバの負荷に応じてクラウドサーバの増減を調節するオートスケールであるため、急なアクセス増などによる負荷上昇時でも安定したサービス提供が可能とのことだ。
同社は同サービスによって実現可能なイメージ例として、オンライン上やメタバース上での接客AIを紹介している。マルチモーダルAI技術を搭載したAIチャットボットをメタバース上で提供することで、より没入感のある接客が実現できるという。また、コールセンターの人材トレーニングや社員のメンタルウェルネスサポートにも活用できるようだ。
なお、導入時の初期費用や運用費用は要件によって異なるため、「AI suite」を用いたサービス展開を検討する場合は要問合せ。