Windows 10 Anniversary UpdateでMicrosoft Edgeに音声合成APIを導入

6月1日(現地時間)、Microsoftは2016年夏リリース予定のWindows 10 Anniversary UpdateのMicrosoft Edgeが音声合成APIを導入することを公式ブログで明らかにした。音声合成APIはW3C(World Wide Web Consortium)の「Web Speech API Specification」に準拠し、音声出力を制御するSSML(Speech Synthesis Markup Language) バージョン 1.0にも対応する。

「Speech Synthesis API」デモンストレーションサイトにWindows 10 ビルド14316以降でアクセスすれば、音声合成APIを試すことができる

既にMicrosoft EdgeHTML 14.14316から対応し(執筆時点の最新版はバージョン14.14352)、対応する環境でデモンストレーションサイトにアクセスすれば実際の動作を確認できる。APIはJavaScriptからアクセスし、音声再生の状態確認やコントロール、音声サービスの設定などが可能。その結果、音声ピッチの変更や単語や文書のセンテンスを分析できる。

デモンストレーションサイトで選択できるのはWindows 10にインストールしている言語のみ。例えば一般的なWindows 10 Insider Preview日本語版の場合、選択できる音声合成エンジンは日本語の「Microsoft Ayumi/Haruka/Ichiro Mobile」に限定される。音声合成は英語－英語、フランス語－フランス語、スペイン語－スペイン語が選択可能。仮にMicrosoft Translator APIを併用すれば、音声翻訳も実現しそうだ。

阿久津良和(Cactus)