Google DocsをOCRとして利用する方法

Create and edit web-based documents, spreadsheets, and presentations. Store documents online and access them from any computer.

GoogleはここのところGoogle Docsの機能強化を積極的に進めている。新しい機能の追加やUIの改善を繰り返し、以前はできなかった作業がいつのまにかできるようになっているといったことが少なくない。統合オフィスアプリケーションとしてのみならずネットドライブとして利用できるようにする機能も登場しており、今後主力サービスのひとつとして開発に注力していくとみられる。

最近Google Docsに追加された新機能のうち興味深い機能のひとつにOCRがある。テキストが印字された画像ファイルからテキストを抽出しドキュメントとして編集できるようにするというもの。変換はアップロード時に指定することが可能で、該当するオプションにチェックを入れてアップロードを実施すると、画像ファイルではなくテキストファイルとして変換後のデータが登録されるようになる。


読み取るものととなる画像ファイル(英語)	画像ファイルのアップロード時に「PDFや画像ファイルからテキストをGoogleドキュメントのドキュメントに変換する」にチェックを入れる

アップロードする段階で該当するオプションにチェックを入れなければ、画像データそのものとしてアップロードが実施される。対応しているデータはJPEG、PNG、GIFおよびPDF。


変換されたあとのテキストファイル	画像ファイルのアップロード時にチェックを入れなければ、そのまま画像としてアップロードされる

今回追加されたOCR機能は日本語には対応していない。日本語を含む画像をテキスト変換でアップロードしても、なんの文字列も抽出されない。現段階で対応している言語は英語、フランス語、イタリア語、ドイツ語、スペイン語など。読み取りおよび変換の技術にはGoogle Booksの技術が流用されている。


読み取るものととなる画像ファイル(日本語)	日本語テキストからはなにも抽出されなかった

この機能は印刷された紙の資料を自動的にテキストに変換してGoogle Docsで管理するといった用途に向いている。すべて自動的に変換するため抽出精度はそれほど高いとはいえないようだが、机の上に山のように紙の束を載せたままにするよりは、いくぶんましと言えるかもしれない。今後日本語が対応言語に入るかどうかが注目される。