NTTドコモは、写真や画像からの文字認識を可能にする技術を独自で開発し、同技術を携帯電話アプリやWebサービスの開発に活用できるように、APIとして無償でトライアル提供すると発表した。提供期間は2011年12月1日から2012年5月末までで、10月5日よりAPI利用申し込みの受付を開始する。
同社が提供する文字認識APIは、携帯電話で撮影した写真などに含まれる文字や言葉を、高精度に認識できることが特徴という。文字認識では、風景写真のように複雑な画像に含まれる文字の認識はこれまで困難だったが、同社では単語データベースと認識した文字の並びを照合し、文字以外の不要な部分を除去しつつ誤った結果の訂正を行うことで、精度の高い文字認識を実現している。
文字認識API使用例と認識例(同社サイトより)。文字認識APIのWebサイトでは、カーソルを認識文字にあわせると、画像の読み取り部分が表示されるようになっている |
現時点で100万語を超える単語の検出が可能という。
APIの利用で、文字認識技術をベースとしたナビゲーションや地図、辞書、翻訳、旅行、物品管理など様々なサービスとのマッシュアップが可能になる。
APIトライアル利用の申し込みについては、Webサイトで公開されており、同社としてはトライアル提供を通じて得た開発者からの意見をもとに、APIの改善を図り、商用提供に向けた技術開発に活かすことを目的とした提供となる。