近年、働き方改革やデジタル・トランスフォーメーションが叫ばれている。しかし、企業内にある紙の帳票をデータ化する際、手動での入力を続けている企業は、まだまだ多いのではないだろうか。

最近は、スキャンした帳票からテキストデータを抽出する文字認識技術(OCR)を使ったサービスを目にする機会も増えてきた。とはいえ、OCRの精度が低ければ、結局人の手で入力し直さなければならない。果たして、OCRサービスは実用性があるのだろうか。

そこで、OCRのサービスであるAI帳票特化型RPA「LAQOOT」を提供しているユニメディアに足を運び、実際のサービスがどのように動いているのかデモを行ってもらった。本稿では、その様子からOCRの実用性について検証してみる。

OCRによる文字認識はどうしても人のチェックが必要

同社が提供する「LAQOOT」は、AI文字認識エンジンが組み込まれた帳票処理業務用RPAサービス。ディープラーニング技術を活用した文字認識を行うAIに加えて、クラウドソーシングのユーザーによる分散型コンペア入力機能を搭載しており、AIだけでは読み取れない文字でもデータ化することができる。

紙の帳票をデータ化するにはまず、スキャンした帳票画像をドラッグ&ドロップで、管理システムにアップロード。次に、座標設計を行い、画像データ上の場所を指定して、どこに何が書かれているのかを意味付けする。一度設計を行えば、テンプレートとして同じレイアウトの帳票なら何度も利用することが可能だ。また、RPAを活用することで、自動化の範囲を拡大させることもできるだろう。

  • PDFのアップロード画面

    画像データのアップロード画面

  • 座標設計中の画面。範囲を指定して、項目名などを入力する

    座標設計中の画面。範囲を指定して、項目名などを入力する

座標設計が終わればデータ化が始まるわけだが、LAQOOTでは、AIによって文字認識が行われると同時に、同社の提携しているクラウドソーシングユーザー(作業者)に「苗字だけ」「名前だけ」といったような、分解された帳票の画像データ(一部)がランダムに送られる。

作業者とは、クラウドソーシングのサイトに登録している一般ユーザーのこと。現在100万人ほど登録されているという。作業者は送られてきた分解後の帳票データ(一部)について、スマホやパソコンからテキストを入力する。入力した量に応じて、作業者はポイントなどの報酬を受け取ることができるという仕組みだ。

  • 作業者に送られてくる入力タスク画面

    作業者に送られてくる入力タスク画面

そして、AIが判断した文字認識データと作業者が入力したデータを突合して、一致すればデータを抽出。一致していなければ別の作業者が自動的に追加される。イメージとしては多数決。入力された内容が一致した時点で多数ある内容が正とみなされ、データ化されるわけだ。たとえば、複数の作業者がAIと異なる入力をした場合、AIが誤っていたとして作業者の入力したデータが採用される。

ちなみに、データの抽出までの所要時間は、最短で1時間。1日1万枚以上データ化することもできるという。深夜でも作業者はいるそうなので、夜に発注して翌朝出社するとデータ化が完了しているという使い方もできるだろう。現在は申し込み書をはじめ、アンケート、納品書などを電子化したいというニーズが多いという。

  • 入力が完了するとテキストデータをCSVファイルでダウンロードすることが可能

    入力が完了するとテキストデータをCSVファイルでダウンロードすることが可能。データのダウンロードの前には、必要に応じて目視チェックのツールも使える

一連の流れを見せてもらって感じたのは、まだまだAIは発展途上ということだ。現在は、スキャンをしたあとにノイズ除去など特殊な処理を施すことで、OCRのポテンシャルを最大限発揮させるサービスなども出てきている。しかし、それでもやはりAIは万能ではない。また、AIが正しい入力をしたとしても、正しいか否かを判断できるのはあくまで人間だ。そのため、現時点では、OCRで帳票の電子化をすべて完了させようと思うのではなく、目視確認を行う人材を確保するか、外部にチェックを依頼することが必要だろう。

もちろん将来的には、正誤判定を行えるAIが出てくることも考えられるが、それまでは、いきなりすべてをAIに置き換えるのではなく、人間の能力で補完していきながら、学習によってAIは精度を高めていくということが大事なのかもしれない。