東芝デジタルソリューションズは9月1日、ディープラーニング技術を活用した高精度機械翻訳サービス「DOCCAI翻訳(ドッカイホンヤク)」の提供を発表した。
同サービスは、NICT(国立研究開発法人情報通信研究機構)の最新の国産機械翻訳エンジンと東芝グループの40年以上にわたる機械翻訳のノウハウに、AI-OCRによる文書自動読み取りを組み合わせたものだ。
業務分野に特化した翻訳や、短時間での大量の翻訳が可能で、AI-OCR機能を用いて紙文書のスキャンデータや画像データについて、レイアウトを維持したままテキスト化が可能なため、今まで機械翻訳をすることができなかった多様な文書でも多言語に翻訳することができる。
対応言語は英語、中国語(繁体字/簡体字)、韓国語、ロシア語、フランス語、イタリア語、ドイツ語、スペイン語、ポルトガル語、ベトナム語、アラビア語の計11か国語となる(すべて日本語との双方向に対応)。
対応ファイル形式はWord、Excel、PowerPoint、PDF、CSV形式、html、テキストとなる。AI-OCRに対応するファイルは、PDFと画像ファイル(対応拡張子:.tif、.jpg、.png)だ。
「DOCCAI翻訳」は言語方向数(翻訳エンジン稼働数)による月額固定の料金体系となっており、ユーザー数や翻訳量といった利用量については無制限だ。同社が提供するミニマムライセンス(8プロセス)での費用(税込)は110万円となる。
専門用語や表現については、ユーザー辞書登録や翻訳メモリで追加学習が可能だ。また、翻訳した文書データの一定期間後の自動削除設定や、翻訳履歴(翻訳処理時のテキストログ)の削除にも対応する。加えて、クローズドネットワーク内での利用も可能だ。