NTTドコモは11月4日、「通訳電話サービス」に関する記者説明会を都内で開催した。音声認識などの技術を組み合わせたサービスで、異なる言語間でのスムーズなコミュニケーションを可能にすることを目的にしている。当面は協力企業・団体・一般モニターを対象にした試験サービスが行われ、一般ユーザー向けには2012年の下期に提供が開始される予定。

多様なサービス業者とのタイアップを予定している(写真右)

通訳電話サービスの仕組み(写真左)

ドコモではこれまで音声入力メールや音声クイック起動、声の宅急便などの「音声サービス」に積極的に取り組んできたが、今回のサービスはその延長線上にあるもの。具体的にはフィーチャーフォンやスマートフォン、通話機能を備えるタブレット端末などに日本語で話しかけることで、その内容がドコモのネットワーク上で外国語に翻訳され、発話してから2秒ほどのタイムラグで相手側に文字と音声の両方で伝わる仕組みだ。相手の話した内容も同様の速さで日本語に翻訳され、こちらに伝わる。音声認識、機械翻訳、音声合成などの処理は同社のネットワーク上で実施されるので、携帯電話端末のスペックには影響されず、誰でも気軽に相互同時通訳サービスが利用できるという。11月4日から一般モニターの公募が、9日から協力企業・団体への試験サービスが開始される。

会場では異なる2つのシーンを想定したデモンストレーションが行われた。ひとつは「遠隔利用型」と呼ばれているもので、日本人ユーザーが英語圏にいるレストランの店員に席の予約をする様子が再現された。利用方法はとてもシンプルで、通話者が端末上で「発話を開始する」ボタンを選択して会話するだけだった。相手側の端末には原語と翻訳された言語の両方が文字表示され、同時に合成音声による通訳の声が電話口に再生された。

英語圏の外国人と通話するデモの様子

もうひとつは「対面利用型」と呼ばれているもので、日本に遊びに来た韓国人がホテルのロビーで日本人スタッフとやりとりする様子が再現された。こちらはお互いが同じタブレット端末に話しかけることで、ひとつの画面でコミュニケーションが成立できるものだった。

タブレット機を使ったデモの様子

登壇したネットワーク開発部担当部長の那須和徳氏によれば、ドコモ社内でのテストでは日本語の認識精度は85%~90%、英語は60%~80%程度だという。英語、韓国語に対応しており、2012年1月下旬からは中国語にも対応する予定。また、他言語も順次サポートしていくとしている。利用を想定している分野は観光、教育、小売り、医療など。

「ビジネスモデルとしてはまだ白紙の状態。今後とも研究開発を進めていきたい」と那須氏

本サービスでは音声認識や機械翻訳などの分野で外部の技術とドコモの技術を融合させているという。同社研究開発センター所長の小森光修氏からは「本サービスはオープンイノベーションであり、ドコモの独自技術にこだわらない。世の中の良い技術を取り入れてよりスピーディーに市場に展開していきたい」との話があった。

「言葉の壁を越えたコミュニケーションを実現してくれるもので、将来の夢の技術」と小森氏

質疑応答では、方言はサポートしているか(音声認識の面では問題ない。事前に辞書登録をすれば「おおきに」もThank youと翻訳できる)、個人情報の保護や通信の秘密は守られるのか(ユーザーには利用規約への承諾をしていただいた上で利用していただく)、現在の技術的な課題は(方言・固有名詞など登録していない単語への対応と、雑踏などの中での認識精度)、現在単語はどのくらいの数が登録されているのか(日本語では40万語、英語でもそれ相当。地名など固有名詞の分野はまだまだ弱いと認識)などのやりとりがあった。