OCR機能でテキストデータに変換されるときの精度は、文書によって異なる。例えば、レイアウトの複雑なドキュメントよりも、段組みが1つから2つの単純なレイアウトのほうが正しく認識されやすい。また、仕切りが多い複雑な表や、表の中に表があるような入り組んだ表よりも、単純な表のほうが変換に適している。

プレゼンテーションスライドも同じで、文字や図が複雑に配置されていたり、文字の背景に写真や模様などがあったりする場合よりも、無地の背景に文字と図表がシンプルに組み合わさっていたほうが正しく認識・変換されやすい。

一般的に苦手とされる複雑なレイアウトのカタログを変換してみたが、表などの再現性はなかなか高い

ScanSnapの仕様一覧を印刷し、Excel形式に変換したもの。写真などの要素はすべて削除されるので、この場合はWord形式に変換して画像だけを貼付けるという方法が使える

こちらはPowerPoint形式に変換したもの。例としてシンプルな原稿を作ってみたので、再現性とOCR精度が高かった

OCRの認識精度を高める設定

認識精度をアップするには、iX500の読み取り設定の画質を「ファイン」もしくは「スーパーファイン」にし、圧縮率を「1」に設定すると良好な結果が得られやすい。より高解像度でスキャンする「エクセレント」では、原稿の表面に紛れ込んだゴミを拾いやすくなり、逆に認識率が落ちるケースが出てくる。

読み取り設定を変更するには、通知トレイ(デスクトップ画面の右下)から「ScanSnap Manager」の設定画面を呼び出す。「Scanボタンの設定」を選択すると設定画面が表示されるので、「読み取りモード」で画質を選択し、「ファイルサイズ」タブで圧縮率を変更する。最後に「OK」をクリックすれば設定が保存される。

ScanSnapのアイコンを右クリックして、「Scanボタンの設定」をクリック

「読み取りモード」タブで画質を設定する。デフォルトは「自動解像度」が選ばれている

「ファイルサイズ」タブで圧縮率を変更する。デフォルトは「3」なので、「1に」変更する

なお、PCにOfficeアプリケーションがインストールされていなくても、ABBYY FineReaderを利用することが可能だ。この場合、変換後にアプリケーションを起動しないように設定しておくといい。クイックメニューから設定を変更するには、ボタンの上にカーソルを移動して、歯車のアイコンをクリック。設定画面が表示されるので、「認識したドキュメントを開く」のチェックを外せばいい。

クイックメニューのボタン上にカーソルを移動して、歯車のアイコンをクリックする

ABBYY FineReaderの設定が表示される。「一般設定」タブでは、全体の動作に関する設定がまとめられている

Word/Excel/PowerPoint文書に変換するときの設定も用意されている。変換後のレイアウトに関する設定が多いので、一通り目を通しておきたい