東芝は、同社特許技術「複数素片選択融合方式」を用いた合成音声を作成できる企業向けのクラウドサービス「ToSpeak Online(トゥースピーク オンライン)」の提供を開始した。価格は15,000円(税別)から。
このサービスは、Webブラウザ上でテキストを入力するだけで、音声を作成・編集できる合成音声作成ツール「ToSpeak Editor Online」を利用し、合成音声ファイルを作成できる。タイプの異なる5種類(男性2種類、女性3種類)の話者が用意されているほか、オプションで任意の話者の音声辞書を個別に作成することもできる。現在は日本語のみだが、今後は英語、中国語から順次対応していく予定だという。
声の高さや太さ、話す速さなどを調整できるほか、SSML(Speech Synthesis Markup Language)相当の制御タグを用いた合成音声の細かなチューニングも可能で、専門的な単語やフレーズ、商品名や略語などの特別な読み方を登録できるユーザー言語辞書が用意されている。
料金は、5,000文字ごと15,000円(税別)~のライトプランと、文字数無制限で月額100,000円(税別)~のスタンダードプランが用意されている。
WebサービスやWebアプリケーションなどから音声読み上げ機能を利用できるインタフェース「ToSpeak Web API」もあり、こちらは月額50,000円(20万文字、税別)~の従量制プランと、月額180,000円(文字数無制限、税別)~の定額制プランがある。
対応ブラウザは、Internet Explorer 6.0/7.0/8.0、Firefox 3.6で、プラグインとしてAdobe Flash Player 10.1以降が必要。主な用途して、教材やマニュアル、e-learningなどの教育コンテンツ、デジタルサイネージなどの広告コンテンツ、ニュース、天気、交通情報、メール、スケジュールなどのテキスト情報のリアルタイム読み上げ、ソーシャルゲーム、Webページの読み上げ、施設内アナウンス、観光案内、機器向けガイダンス音声、スマートフォン向けアプリなどが想定されている。