NTTドコモブース

現在開催中の「Mobile World Congress 2011」でNTTドコモは、現在開発中の新技術として、同時通訳サービスや情報漏えい対策ソリューションを紹介している。なお、2012年末をめどにサポート予定の「NFC」の展示については、こちらの記事で紹介している。

話した言葉をすぐに英語に翻訳する同時通訳サービス

ドコモのLTEサービス「Xi」向けのソリューションとして展示されていたのが「モバイル同時通訳システム」。Xiの高速・低地遠・大容量という特徴を生かしたサービスで、Xiの発表時に今後のサービスとして紹介されていたものが、今回は初めて実際のデモとして展示されていた。

音声を話して認識された言葉(上段)と翻訳結果。騒音の多い会場内のため、最初は認識失敗しているが、普通に話すぐらいの感覚でしっかりと認識・翻訳されていた

このシステムは、携帯電話に向かって話した言葉が、リアルタイムに翻訳され、相手の端末側には翻訳された合成音声が聞こえるというものだ。普通の会話と同じように日本語で話すと、それが2~3秒後には英語で相手側に伝えられ、自分の手元には認識された日本語が表示されるため、誤認識があった場合でも修正しやすい。音声認識はサーバー側で行い、男女や年齢、なまりなど、複数の音声タイプが登録してあるため、最初から高い認識精度を誇るという。また、今回は旅行を想定したチューニングを行っており、旅行で起こりえるような内容の言葉であれば、日本語から英語の翻訳は平均で8割、英語から日本語への翻訳は6~7割程度の認識率だという。

このシステムではVoIPを使っており、今回は3Gネットワークを使ったデモのため2~3秒程度の時間がかかったが、LTEは低遅延という特徴があり、音声を認識して相手側に聞こえるまでの時間をさらに短くできるそうだ。ドコモのXi端末は、現時点ではデータ端末しかないが、音声端末が登場し、さらにLTEでのVoIPサービスが開始されて以降の提供になるそうだ。そのため、今回のシステムの登場時期などはすべて未定だ。

今回のシステムでは、音声認識はアドバンスト・メディア、翻訳はクロスランゲージ、音声合成はHOYA、システムインテグレートはHPが担当しており、ドコモはネットワークサービスを提供する形だ。現在は英語だけの対応だが、今後中国語や韓国語への対応も検討していくということだ。

さらに、ドコモブースでは6つの文字を手書き入力して写真に撮るだけで、漢字、ひらがな、カタカナ、英語のフォントを自分の手書き文字風に変換するサービスも展示。テキストメッセージによるコミュニケーションに手描きの表情を加えることができるようになる。さらに自分の顔写真をアップロードすると、それを3D化し、テキストにあわせてしゃべるアバターを作成できる。

手書き文字風のテキストで、自分の3Dアバターが話すようにコミュニケーションできるサービスのデモ

手書き文字はこの6文字を書くだけでいいという

また、シマンテック、インテルと協業した情報漏えい対策ソリューションも展示していた。これはインテルのアンチセフト・テクノロジーを使い、ドコモのSMSを受信したPCのデータを削除したり、ロックしたりできるというもの。シマンテックのソフトウェアによってPC内のデータの暗号化も行われており、管理者がサーバーの管理画面からSMSを送信するだけでデータ消去などが行える。現時点では今春以降に発売されるPCに搭載された、エリクソンの3Gモジュールに対応しているが、今後対応モジュールが拡大される可能性もあるそうだ。

エリクソンの3Gモジュール(左)を搭載したPCに対し、管理者のPC(右写真右側の端末)などからWebベースの管理画面にアクセス、端末を指定してSMSを送信することで、紛失などしたPCのデータロックや削除を行える

そのほか、昨年のCEATEC JAPANでも展示されていた裸眼立体視可能な3Dディスプレイを海外で初めて展示。さらに木製パネルを使ったTOUCH WOOD SH-08C、シャープの3Dディスプレイ搭載スマートフォンなどの各種端末の展示を行った。

欧州メディアなどに特に注目を集めていたというTOUCH WOOD

スマートフォンやフィーチャーフォンの新製品も並べていた