富士通研究所は4月6日、英文特許の理解を助けるための特許読解支援技術を開発し、ジー・サーチが提供する特許情報配信サービス「フォーカス」への適用を開始したと発表した。
富士通研究所が開発したのは、英文特許の特徴的表現に着目して定型文の雛形を適用する「特許定型文の雛形起用技術」と、分割された英文からブロックごとに分類に適した日本語の文章を生成する「分割&組み立て翻訳技術」の2つ。
「特許定型文の雛形起用技術」は、「カンマまでを1つのブロックとする、または、英文特許によく表現される"comprising"という単語が出てきた場合、その前までを1つのブロックにする、などのルールに沿って文章を分割する」といったことを実現するもの。さらに、「隣り合うブロックが並列の意味なのか、階層関係の意味なのかを判断する」といったように、雛形の適用によって分割された英文の論理構造を解析する。これにより英文特許の文書を主題、構成要素、説明などの意味のあるブロック単位に分割し、英文のままブロックの種類で色分けして表示することが可能になったとのことだ。
「分割&組み立て翻訳技術」は、「主題、構成要素なら名詞句として、説明なら文としてスタイルを変えて翻訳し、全体で自然な日本語になるように語順への並べ変えを自動で行う」といったことを実現可能にする。従来の仕組みでは英文特許全文を一度で機械翻訳していたとのことだが、この技術によって「ブロックごとの短い文をそれぞれ翻訳するようになったため、機械翻訳の大幅な品質向上を実現した」という。
今回発表された技術による効果として同社は、「英語のスキルを問わず英文特許の読解を支援できるようになり、原文と翻訳された日本語を見比べる時でも項目ごとに簡単に比較できるため、従来比で平均3倍の効率で英文特許の内容を理解することが可能」だとしている。
同社は今後中国語や韓国語などへの対応を進め、対象言語を広げていく予定。