ソースネクストは3月19日、録音した音声を自動でテキスト化するサービス「AutoMemo」(オートメモ)に、文字起こしが完了したデータをAIが自動で要約する「要約機能」をベータ版として搭載した。
ベータ版という位置付けのためリリース時点では無料だが、利用回数に制限があり、月額プラン・年額プランのユーザーは2024年5月の更新分まで毎月5回まで利用可能。お試しプランのユーザーは月1回まで利用できる。
AutoMemoシリーズは、録音した音声ファイルをAIが文字起こしし、テキストで内容を確認できるサービス。今回追加された「要約機能」は、文字起こし完了後、要約ボタンを押すことで、全体の要約と話者ごとの要約が出力されるものだ。1時間以上かかった長い会議で出力された文字起こしテキストをすべて追わなくても、手軽にその概要を確認できるようになる。
全体の要約は「要約」「決定事項」「共有事項」という3つの要素に分かれて表示。話者ごとの要約では、参加者1人1人の発言が人物ごとにまとめられ、議論の流れや意見の変遷が視認でき、内容を理解しやすくなる。
AutoMemoでは、録音データを受信したあと、ノイズキャンセリングや音量の最適化、人間の声の検出、文字起こし、話者判別、文書整理などの処理を、それぞれに最適化した各AIで行っているという。文字起こし処理には生成AIサービス「ChatGPT」を開発したOpenAIの音声認識モデル「Whisper」を一部に採用する。
今回の要約機能はOpenAIの大規模言語モデルGPT-4を使い、人間が作成した“読みやすい要約”をベースに、AI処理でこの“読みやすい要約”に近づける調整を重ねたとのこと。「全自動で簡単」「高精度」「要点を押さえたアウトプット」の3つを強みとして、2024年5月末まで試験的にリリースし、フィードバックを踏まえて正式提供を目指す。
AutoMemoの利用料金は、お試しプランが無料・文字起こし時間1時間/月、月額プランが1,480円/月・文字起こし時間30時間/月、年額プランが12,800円/年・文字起こし時間30時間/月。