NTTテクノクロスは2月19日、音声合成ソフトウェア「FutureVoice Crayon」の新バージョンを、2019年9月から提供開始していることを発表した。

  • 合成音声でも動作に合わせた自然な発声が可能

    合成音声でも動作に合わせた自然な発声が可能

音声合成における感情表現は、期待通りの感情を表現した音声を作成することが困難なこと、そして悲しい声や楽しい声など感情ごとに音声を収録しモデル化するには作成コストと期間がかかるという課題があった。

「FutureVoice Crayon」の新バージョンでは、深層学習(DNN)を活用することで、感情を込めた少量の音声からより人に近い、肉声感のある感情表現が可能な合成音声を実現しているという。

また、人物やキャラクターなどの複数の音声を利用して新たな声を作り出すことが可能。これにより、特定の人の声の権利に依存せず、実在しない独自の声や平均的な声を作り出せるようになっている。

さらに、発話情報(読み・時間)を出力してCGやロボットの動作と連動できるという。唇や身体の動きと合成音声の発話タイミングをより正確に同期でき、自然な発話を実現しているという。

  • AI×CGアナウンサー 花里ゆいな

    AI×CGアナウンサー 花里ゆいな

なお、ファーストユーザーとして、テレビ朝日が2月10日深夜に放送した「CGアナウンサーの番組ニュース」に出演した「AI×CGアナウンサー 花里ゆいな」に、FutureVoice Crayonの新バージョンで作成した合成音声が利用されたということだ。