文档图像识别预理研究.pdfVIP

  • 19
  • 0
  • 约7.8万字
  • 约 61页
  • 2015-12-23 发布于四川
  • 举报
文档图像识别预理研究

南京邮电大学 摘要 摘要 随着计算机技术的推广应用,人类越来越多的依赖计算机获得各种信息,大量的信息 处理工作也都转移到计算机上进行,存在着大量的文字信息处理问题,因而将文字信息快 速输入计算机的要求就变得非常迫切。本文将研究重点放在了OCR预处理方面,对其中 的一些算法提出了自己的改进意见,并且用C/C++实现算法,进行实验,分析结论。本文 的主要工作总结如下: 1. 图像二值化方面。提出了一种新的基于数学形态学的二值化算法,用数学形态学 的方法将图像背景提取出来,得到零背景的图像,对零背景图像再进行二值化,解决了在 图像获取过程中背景不均匀问题。 · 2. 图像倾斜校正方面。选取竖直扫描黑游程的中点为直线拟合的特征点,用最小二 乘法进行直线拟合得出倾斜角度,将图像以左下点为旋转中心进行旋转,并按照旋转后新 图像的宽、高扩大区域,完成倾斜校正。 3. 版面分析方面。提出了一种非文本块优先的方法。该方法,扫描文档图像做连通 域搜索,抽取所有的连通域,根据连通域的尺寸特

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档