Sansanは11月27日、同社のデータ統括部門であるDSOC(Data Strategy & Operation Center)が、名刺の取り込みに特化した独自のOCR(光学文字認識)エンジン「DSOC OCR」を新たに開発したと発表した。現在、DSOC OCRは「Eメールアドレス」と「氏名」に対応しており、Eメールアドレスに関しては、99.7%の精度でデータ化することが可能としている。なお、DSOC OCRは名刺全体にデータ化範囲を広げるように、「社名」「役職」「住所」「電話番号」など順次開発を進めていく。

DSOC OCRは、名刺に特化した当社独自のOCRエンジンで、DSOCに所属するKaggleグランドマスターを中心に開発。これまでのDSOCのデータ化ノウハウをOCRエンジンに展開することで、現段階ではEメールアドレスと氏名のデータ化に対応し、Eメールアドレスのデータ化精度においては99.7%を実現している。

OCRは撮影された画像により、精度にばらつきが出るものの、DSOC OCRはSansanのデータ統括部門が名刺のデータ化に用いたノウハウを用いることで、定型・不定形や撮影された環境を問わず、すべてのデータにおいて99.7%の精度で、Eメールアドレスのデータ化を実現するという。

また、OCRではデータ化後に即使用するシーンでの活用が求められるため、正確さだけではなく、スピードも求められることから、DSOC OCRでは、0.3秒の即時デジタル化に対応した、ハイパフォーマンスを実現しているという。