人工知能で手書き文書を楽々データ化。事務処理の時間もコストも削減

オフィスワーカーが一度は感じる「あったらいいな」のひとつに、「この書類、誰か入力しておいてくれないかなぁ」という、素朴だが切実で非常に大きな願望が挙げられるだろう。昨今、技術の革新によって書類をスキャンしたデータからテキストデータを生成してくれるOCRによって願いが叶えられたかに思えた。だが実際は、データ化した内容を改めてチェックしてみると読み取り精度のバラツキにガッカリ……。結局は手入力に勝るモノはないのか、と諦めていた方々にご紹介したいのが、今回取り上げるAI insideマーケティングが販売を取り扱う人工知能により手書き文字を高精度でデータ化してくれるクラウドサービス「AI inside」だ。

AI insideマーケティングWebサイト。サービスの全容や導入事例も記載されている

このAI insideの最大の特徴は99.89%(AI inside社推奨の環境下においての読み取り精度)にも及ぶという読み取り精度の高さにある。多岐にわたるデータ処理が可能な人工知能「Neural X」の画像認識と自然言語処理の機能を主に活用することにより、手書き文字を高い精度でテキストデータ化してくれる。用紙の記入欄からはみ出ているものや日本の商習慣で用いられる文字を間違えた際に二重線で消すといった手書きならではの文字にも対応している。

こちらの資料は、さきごろ開催された「総務・人事・経理ワールド2016 ワークスタイル変革EXPO」(公式Webサイト)で配布されていたもの。読み込み精度のサンプルなのだが、AIを活用することで高い認識率を誇っているのがわかる

原本と従来OCRでの読込み

AI insideでの読込み

記入欄からはみ出してしまった文字の場合、通常のOCRでは正しく認識されないことも。また、自然言語処理や機械学習により日本の商習慣で使われる機会も多い訂正線もキチンと認識し、必要の無い文字として余計なテキストデータを出力しない

また、高い精度を実現するために同社では、ヒアリングや実際にサービスを利用してテキストデータ化したい書類のサンプルを預かり、テストを実施した上で98%以上の読み取り精度に達した段階でサービスインへとステップを進められるのも、ムダな導入コストを費やすリスクを軽減してくれるというもの。

加えて、簡便な利用方法も特徴と言えるだろう。データ化したい書類をスキャナーや写真等で画像あるいはPDFとし、17時までにクラウド上の特定のフォルダに格納しておくだけで翌日11時にテキストデータ化されたCSVファイルが納品されるという簡単なオペレーションフローとなっている。