- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种改进文本图像二值化方法
一种改进的文本图像二值化方法
摘要:针对常用的局部阈值方法-Niblack算法中存在的问题,提出了一种改进的文本图像二值化算法。改进后的Niblack算法对背景灰度不均匀的图像具有良好的适应性, 抗噪声能力强,保持笔画连通性好, 更适合于文本图像的二值化。实验证明了该算法的有效性。
关键词:文本图像;二值化;局部阈值;全局阈值;Niblack算法
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2014)12-2822-03
An Improved Binarization Method for Document Image
BU Fei-yu
(Institute of Information Science and Engineering, Hunan City University,YiYang 413000, China)
Abstract: After analyzing the shortcomings of Niblack algorithm, which is one of the commonly used algorithms based on local threshold, this paper proposes an improved binarization algorithm for document image. The improved approach is robust to noise and makes connectivity of stroke better. The experiment results have proved the advantages of the proposed algorithm.
Key words: document image; binarization; local threshold; global threshold; niblack algorithm
文本图像的二值化效果是影响OCR(光学字符识别)系统性能的主要因素,研究人员为此作了大量工作。二值化方法可分为全局阈值法和局部阈值法。全局阈值法根据文本图像的直方图或灰度空间分布确定一个阈值,算法较简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对光照不均匀、噪声干扰较大的图像,二值化效果明显变差。局部阈值法通过定义考察点的邻域,并由邻域计算模板实现考察点灰度与邻域点的比较,根据区域灰度分布特性,自适应调节阈值。典型的局部阈值法有均值分割法、Kamel-Zhao算法[1]、Bernsen算法[2] 、Niblack算法[3]等。局部阈值法较全局阈值法有更广泛的应用,但缺点也较明显,如速度慢、容易出现伪影现象和笔画断裂现象。
近年来,对文本图像二值化的研究仍在继续。如Gatos提出了针对退化文本图像的二值化方法[4];Bolan Su则提出将多种文本图像二值化方法结合使用[5]。文献[6]针对Bernsen算法提出了一种改进算法,通过引入一个简单的整体阈值进行辅助判断,对算法得到的阈值曲面进行光滑处理并对局部窗口的极大、极小值进行考察,从而较好地避免了伪影及笔画断裂。文献[7]和[8]分别将谱聚类和图谱理论应用于文本图像二值化算法中。文献[9]对一种基于局部阈值分割的LLT算法给出了改进方法。文献[10]则在Niblack方法的基础上提出了一种改进的针对退化文本图像的二值化方法,该方法仅在文本区域周围较小范围内进行局部阈值计算,减少了运算量,克服了Niblack方法容易产生大量背景噪声的缺点,对于低对比度的文本图像有更好的适应性。
到目前为止,还没有一种通用的文本图像二值化方法[11]。寻找更好的文本图像二值化方法,仍然是图像处理研究领域的目标之一。该文以Niblack算法为基础,针对Niblack算法所存在的问题,综合一些已有算法的优点,提出了一种改进的二值化方法。改进后的Niblack算法抗噪能力强,较好地避免了伪影,并且能最大限度地保持笔画像素。
1 Niblack算法概述
在以下的讨论中,不妨设笔画占据灰度文本图像低灰度级部分,背景占据高灰度级部分。这与一般扫描的文本图像是相符的。
记f(x,y)为图像在考察点(x,y)坐标的灰度,W为估计最大笔画宽度,一般取W=7。考察以(x,y)点为中心的(2W+1)×(2W+1)窗口,则NiBlack算法计算点(x,y)处阈值的公式为:
T(x,y) = m(x,y)-k×V(x,y) (1)
其中m(x,y)和V(x,y)分别是窗口内(2W+1)×(2W+1)个像素点的平均灰度值和均方差,k是根据经验预定的某
文档评论(0)