紙媒体やスクリーンショット画像からテキストを作成

テキストとしてコピー&ペーストできない文字に困るというのはビジネスの中でよくあることで、紙媒体でもらった資料はもちろんのこと、画像化されているウェブサイトの文言や文字が選択できないPDFを前にため息をついたことのある人も多いだろう。

手で入力し直すのはミスも多くなる上に、なにより手間がかかる。そこで利用したいのが「OCR」だ。画像の中から文字を認識してテキスト化する技術で、よく名刺管理アプリなどで利用されている。その、文字読み取り機能だけに特化したアプリが「画像、写真から文字を認識するOCRアプリ」だ。その名のとおり画像に含まれている文字すべてを対象にデータ化を行ってくれる。

画像、写真から文字を認識するOCRアプリ

カメラや既存画像から文章を抽出

アプリのつくりは非常にシンプルで、ユーザーはトップ画面で「画像を選ぶ」または「カメラ撮影」を選択して対象画像をアプリに読み込ませてやればよい。「カメラ撮影」を選んだ場合はアプリ内のカメラ機能が起動するから、ズーム機能などを利用して対象を撮影しよう。シャッターボタンの上にあるカメラマークをタップすればインカメラへの切り替えも可能だ。文字が鮮明に読めるように写真がとれたら、右下の「写真を使用」をタップする。

「カメラ撮影」を選択

対象の書類で文字部分がしっかり読めるよう調整して撮影する

よい写真が撮れたら「写真を使用」をタップ

利用する写真や画像を指定すると自動的に元の画面に戻り、上部に読み込み中の表示が出るはずだ。数秒で認識されたテキストが表示される。部分的に読み取り修正を行う機能などはなく、画像を指定するとテキストが作成されるというだけのシンプルな動きだ。

読み取り中の画面が数秒表示される

全体をテキスト化したものが表示される

既存画像を利用するには「画像を選ぶ」でカメラロール等から画像を指定すればよい。その時、画像が横倒しになっているような時も、事前に回転させる必要はなく、そのままでしっかりと読み取ってくれる。

読み取りの精度はかなり高いが、よりよい結果を得るためにはできるだけ鮮明に文字が読み取れる画像を用意するとともに、周囲に飾り罫や汚れなどが入っていないようにするとよい。スクリーンショットなどをそのまま読み込ませることもできるから、ウェブサイトやPDFを対象にしたい場合にはスクリーンショットを作ってから利用するとよさそうだ。

横倒しに撮影されてしまっている画像はそのまま利用可能

自動的に向きを修正してテキストを読み取ってくれる

多言語・手書きの読み取りにも対応

対象は日本語だけでなく、英語やドイツ語、韓国語、スペイン語、ロシア語など幅広い言語に対応しているようだ。言語によって表記の特徴などから読み取り精度が低めになるものもあるが、データ化した後で読み直して一部修正することを前提に使うならば、かなりの言語で使えそうでもある。

韓国語のスクリーンショットを指定

韓国語もきちんとテキスト化される

日本語の綺麗に印字された書類の読み取りなどは高精度で、特に表や画像を含まない文章はかなりしっかりしたデータになる。ドキュメントを部分的に分けた画像にするなど、ユーザーが工夫すればよりきちんとしたテキストデータが得やすくなるだろう。

さらに、手書き文字の認識にも対応する。精度は活字にくらべれば低くなるが、特別に綺麗な文字でなくとも他人に読める程度に書かれた文字ならばそこそこ読み取ってくれるようだ。

他人に読める程度の文字なら手書きもOK

精度は活字より低いもののそこそこ認識される

修正はアプリ内でOK!読み取り結果はテキストファイルに

読み取った文章の表示されている部分をロングタップすると、文字の修正が可能になる。見たままの折り返しになっている部分の改行を削除したり、ヘッダ・フッタなどを削除したり、読み取りミスのあった部分を修正したりといった作業がアプリ内でそのまま可能だ。もちろん、コピー&ペーストもできる。

テキスト化されたものはアプリ内で修正やコピー&ペーストが可能

「保存する」をタップすると、ファイル名をつけられる。保存はテキストファイル形式で行われ、一旦保存を行うと「メールする」というボタンも表示され、これを利用すれば作成したファイルを添付したメールが作成可能だ。共有系の機能が搭載されていないので、作成したファイルをメールに添付するか、直接コピーして別のアプリに持って行くという使い方になりそうだ。

「保存する」でファイル名をつけて保存

保存後に「メールする」ボタンが出現する

作成したテキストファイルをメール添付可能だ

また、メイン画面の「履歴」をタップすると保存したテキストファイルの一覧が表示される。ここでファイル名をタップすると、元の読み取り完了画面が表示され、テキスト編集が行える仕組みだ。

テキストファイルの管理もアプリ内で行える

制作者:Gen Shinozaki

画像、写真から文字を認識するOCRアプリ