米NVIDIA(エヌビディア)は現地時間11月25日、テキストだけで音楽や音声などサウンドのあらゆる組み合わせを作成できるという、新しい生成AIモデル「Fugatto」を発表。「世界で最も柔軟性の高いサウンドマシン」とアピールしている。
この生成AIモデルでは、テキストと音声ファイルの任意の組み合わせを使用し、プロンプトで記入された音楽や音声、サウンドの任意の組み合わせを生成・変換できるという。テキストプロンプトに基づいて音楽の断片を作成したり、既存の曲から楽器を削除または追加したり、声のアクセントや感情を変更できるという。さらに、“これまで聞いたことのないサウンド”を生成することも可能にした。
Fugattoを使うと、たとえば歌のアイデアを練るためにさまざまな声や楽器を試したり、エフェクトを追加するといったことができるという。ほかにもマーケティングへの活用方法として、広告代理店が既存のキャンペーンを複数の地域や状況に展開するために、ナレーション音声に多様なアクセントなどを適用するという使い方を提案。