アリババクラウドは6月1日、LLM(Large Language Models:大規模言語モデル)の「通義千問(Tongyi Qianwen)」について、同社のインテリジェント・アシスタント「聴悟(Tingwu)」に統合したことを発表した。

  • アリババクラウドは「通義千問」を「聴悟」に統合する

    アリババクラウドは「通義千問」を「聴悟」に統合する

同社が4月に発表した通義千問は、動画や音声ファイルからの要約テキスト生成や、会話の主要な論点の抽出、マルチメディアファイルからのタイムライン作成など、マルチメディアのコンテンツを処理できる特徴を持つ。また、聴悟は音声や動画をリアルタイムでテキストに変換する機能を備え、業務効率化を支援するサービス。

通義千問を搭載した聴悟は「通義聴悟(Tongyi Tingwu)」と呼ばれ、現在パブリックベータテスト中だ。通義聴悟は、職場の効率化だけでなくオンライン教育やトレーニング、インタビュー、ライブストリーミング、ポッドキャスト、短編動画などにも適用可能なようだ。同サービスは、アリババのデジタルコラボレーションワークプレイスである「DingTalk(ディントーク)」にも統合されるという。

同社は聴悟について、今年後半をめどに追加のAI機能を提供する予定だとしている。追加する機能としては、音声・動画ファイルに関するユーザーからの問い合わせに自動でテキスト回答を生成する機能や、動画から抽出したパワーポイントスライドに基づく要約の生成、さらにはブラウザ(Google Chrome)のプラグインとして使用可能な聴悟による英語と中国語間のリアルタイム翻訳などだ。