中国の富士通研究開発中心と富士通研究所は7月10日、オーバーヘッド型スキャナで厚みのある冊子の見開きを撮影した際に生じる書面の歪みをフラットに補正し、読みやすい画像を生成する技術を開発したと発表した。
詳細は8月25日から米国ワシントンで開催される国際会議「ICDAR 2013(International Conference on Document Analysis and Recognition)」にて発表される。
近年、タブレットPCが急速に普及したことで、冊子を電子化してタブレットPCで閲覧したいというニーズが増えてきた。しかし、従来のコンパクトスキャナで冊子を電子化するには、冊子を裁断する必要があるため、裁断を不要にする方式が求められていた。
冊子を裁断しない方式として、冊子をカメラで撮影することが考えられる。しかし、厚みのある冊子の見開きを撮影すると、書面が湾曲するため撮影画像が読みにくくなる。これまで、特殊な模様を書面に投影してその模様の変化から歪みを推定したり、カメラを2台使うことで書面の歪みを推定して画像補正する方式などが提案されてきた。しかし、これらの方式では特殊な装置を必要とするため、コストが高くなるという課題があった。また、1台のカメラのみで補正を行う方式もあるが、ページの谷間の文字が縦長になりやすいなど、歪みの正確な補正が困難だった。
今回、1台のカメラで、撮影した画像からページの輪郭線を正確に検出し、その結果から書面の高さを推定することで画像の歪みをフラットに補正するブック補正技術を開発した。同技術の特徴は大きく3つ。
1つ目は、ページの輪郭線の高速・高精度な検出技術。まず、低解像度の画像を高速で処理して、ページの輪郭線を大まかに検出する。次に、高解像度の画像を用いて、先に求めた輪郭線をもとに微調整を行うことで、正確な輪郭線を検出する。2段階に分けて処理することで、高速・高精度な検出を可能にした。
2つ目は、書面の高さを考慮した画像の歪み補正技術。検出した輪郭線をもとに書面の各場所での高さを推定し、画像の歪みを補正する。ある場所において輪郭線の形状をもとに隣接する場所との高さの差を推定し、差が大きい、つまり湾曲が大きいと判断した場合は大きな補正をかける。逆に、高さの差が小さい場合は、湾曲が小さいと判断し補正量を小さくする。これにより、ページの谷間の文字が縦長になることなく、正しく補正される。
3つ目は、指領域の除去技術。オーバーヘッド型スキャナで厚みのある冊子の見開きを撮影する場合、ページを押さえる指が画像に写り込むことがある。そこで、見やすさを向上するため、指領域の自動検出・除去も併せて行う。
これらの技術によりA4サイズの見開きページを解像度300dpi相当で読み取る場合、約90%の精度で歪み補正を行い、約1.3秒の高速処理を実現した。
同技術により、オーバーヘッド型スキャナで厚みのある冊子の見開きを撮影した際に生じる書面の歪みをフラットに補正し、読みやすい画像を得ることができ、冊子を裁断することなく読み取ることが可能になる。今後は、同技術の高精度化を進めていくとコメントしている。