- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于文字笔画结构文本图像校正处理
基于文字笔画结构文本图像校正处理
摘 要:针对文本图像拍摄质量低下,而导致OCR系统识别率不稳定的问题,本文提出了一种基于文字笔画结构的文本图像校正算法,主要是在图像的预处理中对待处理像素点进行基于文字笔画结构的特征分析,实现目标和背景像素的校正,再结合局部二值化算法进行处理,分析其噪音分布特点采用邻域去噪进一步优化处理结果。实验表明,本文算法能够很好的适用于处理质量低下的文本图像,处理效果从视觉图像和识别率上都能满足应用需求。
关键词:文字笔画结构;特征分析;邻域去噪;低质文本图像
A text image correction algorithms base on the structure of text strokes
ZENG Fan-feng1 FU Ya-nan
(College of Information Engineering,North China University of Technology,Beijing 100144,China)
Abstract:Given the facts that OCR system recognition is unstable because of the low quality text image, this paper put forward a text image correction algorithms base on the structure of text strokes. The algorithm is mainly to analysis the characteristics of the processing pixel based on the text strokes structure, in order to correct the goals pixel and background pixel. Then, combined with local binary processing algorithm for processing, and using neighborhood de-noising method to further optimized image de-noising , The experimental results show that the method can be applied to deal with poor quality text images, and the visual effects and image recognition rate can meet the application.
Key words:structure of text strokes;analysis the characteristics;neighborhood de-noising;poor quality text images
文字是人类用来记录语言的符号,是信息的载体,是人们用来交流和表达思想的工具。纸质媒介是记录文字的传统介质,然而随着信息技术的快速发展,人们逐渐利用计算机、网络、通讯等信息处理技术存放与处理文字。OCR(Optical Character Recognition)识别技术就是将纸质上的打印字符转化成计算机文字最常见的方法。OCR系统一般包括图像获取、预处理、特征抽取、识别分类、后处理以及识别结果6个模块。由于纸质本身、拍摄设备、拍摄环境等各种因素的影响,使获取的图像质量低下,不能直接用于识别。预处理即对图像的存在的问题进行校正处理,是OCR识别的关键步骤,校正内容主要包括灰度化、增强、二值化、去噪、倾斜校正等,其中增强[1]、二值化[2]、去噪[3]的作用是提高图像质量,改善图像清晰度,将目标和背景分离开,也是本文算法要研究的内容。每种校正方法从基本作用和现有处理方法总结如下:增强是将目标点和背景点差异拉大,凸显目标点,抑制非关注的特征,使之改善图像质量,丰富信息量,从作用域可分为空间域增强和频率域增强,其中空间域增强又包括线性增强、分段线性增强、非线性增强;频率域[4]增强包括低通滤波、高通滤波和同台滤波。图像二值化是使目标和背景差异达到最大,产生非黑即白的二色图像,现有的二值化算法非常多见,从处理范围上主要分全局二值化处理和局部二值化算法处理,相结合的二值化算法处理。全局二值化算法有大津算法[5]、梯度算法、最优阈值法等,这类方法是为处理区域选取一个阈值,然后进行处理,优点是处理速度快,缺点对图像质量要求比较高,对噪音敏感,不适用于处理光照不均文本图像;局部二值化算法主要有Niblack算法[6]、Sauvola算法
文档评论(0)