NICTの先進的音声翻訳研究開発推進センターは、ニューラルネットワーク(深層学習)を用いた機械翻訳の実用技術「ニューラル機械翻訳(NMT)技術」を開発したと発表した。
ニューラル機械翻訳(NMT)とは、脳の神経回路を模したニューラルネットワークを用いた自動翻訳技術。膨大な対訳データから学習したニューラルネットワークを用いて翻訳することで、従来技術よりも高い翻訳精度が実現可能になることが確認されつつある。同技術を使用することにより、従来の統計翻訳(SMT)技術に比べ、精度が大幅に向上したという。
NICTは、対訳コーパスから自動翻訳の構築にニューラルネットワークを利用した機械翻訳を2013年から研究を開始し、2016年12月から実用化を加速してきた。実用化には、様々な分野において話し言葉の対話で使われる固有名詞や専門用語辞書の追加が不可欠であり、この手段として「単語とその訳語及びそのクラス(意味分類)」を利用する手法を実装した。また、既にニューラルネットワーク化されている音声認識部分に加えて、今回、翻訳のニューラルネットワーク化を実現し、一般公開されている多言語音声翻訳アプリVoiceTra(ボイストラ)のニューラルネットワーク化を前進させたという。
その結果、意味が通じる率を翻訳者が評価する翻訳精度を大幅に改善し、防災、買物、タクシーなど多分野で9割前後の高精度を達成した。しかし、NMTには特徴的な誤訳のパターンがあり、その様な点の解決が今後の課題となっているという。例えば、「ハム」と「ハムサンド」のような関連語の混同(例9) 、ある表現の繰り返し(例10) 、「テレビ」のような訳語の抜け落ち(例12)等がある。
■改善の具体例
例 1 | 原文 | I'll wait until the terrace is available. |
SMT | テラスがあるまで待ちます。 | |
NMT | テラスが空くまで待ちます。 | |
例 2 | 原文 | Hunger is the best sauce. |
SMT | 空腹であれば。 | |
NMT | 空腹は最高のタレです。 | |
例 3 | 原文 | Yes, you can't take a reserved taxi or a pickup taxi. |
SMT | はい貸切タクシーの送迎タクシーに乗ることはできませんか。 | |
NMT | はい貸切タクシーや送迎タクシーはご利用いただけません。 | |
例 4 | 原文 | There are more and more shops which accept electronic money even though credit cards are not acceptable. |
SMT | 電子マネーカードは使えないものでも受け付けている店も増えています。 | |
NMT | クレジットカードが使えなくても電子マネーを使える店は増えてきています。 | |
例 5 | 原文 | How can I find out which drugs I cannot use? |
SMT | どうやって調べる薬が使えません。 | |
NMT | 使えない薬はどうやって調べればいいですか。 | |
例 6 | 原文 | Let's search a car accessory store by a car navigation system. |
SMT | カー用品店のカーナビで検索してみましょう。 | |
NMT | カーナビでカー用品店を探してみましょう。 | |
例 7 | 原文 | Of course we plan what to do on the assumption to get damaged. |
SMT | もちろん被害想定をどうするかを計画しています。 | |
NMT | もちろん被害を受けることを想定して計画しています。 | |
例 8 | 原文 | This area is the area where inundation has been assumed in the Great Kanto Earthquake type. |
SMT | この地域は浸水想定地域は関東大震災のタイプです。 | |
NMT | この地域は関東大震災型で浸水が想定されている地域です。 |
■改悪の具体例
今回は、日英翻訳の双方向のみだが、グローバルコミュニケーション計画の目標とされる全10言語(日本語、英語、中国語、韓国語、タイ語、インドネシア語、ベトナム語、ミャンマー語、スペイン語、フランス語)をカバーできるよう順次拡大が進められる。さらに、積極的な技術移転により、民間での製品化を推進していくという。また、現在、特許等の書き言葉のために翻訳エンジンのニューラルネットワーク化も推進しているということだ。
なお同技術は、NICTが開発し、公開している音声翻訳アプリVoiceTraに組み込まれており、精度改善を直接体験することができる。