一种改进退化文本图像二值化方法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种改进退化文本图像二值化方法

一种改进的退化文本图像二值化方法   摘要:文本图像二值化是文本图像识别的重要步骤,由于光照不均或文档水渍等原因导致文本图像退化,增加了文本图像识别的难度。本文对一种局部阈值算法进行了改进,首先对图像进行水平投影,根据直方图的极小点对版面进行简单划分,再利用全局阈值法估算出更为准确的各区域字符笔画宽度,从而自适应地得到适当的窗口尺寸,再利用对比图和局部阈值进行图像二值化,并结合OTSU图像消除原算法产生的伪轮廓。实验与分析表明,改进后的方法能够明显消除因笔画粗细不均、字符大小不同而产生的前景像素误识问题。   关键词:文本图像;二值化;局部阈值;退化图像   [中图分类号]TP391 [文献标志码]A [文章编号]   Abstract: Document image binarization is an important procedure for the document image recognition. Degraded document images with uneven illumination or stains often make document recognition hard. In this paper, a local thresholding binarization technique is improved: the image is firstly horizontally projected to segment the image primarily according to the minimum points of histogram. Then more precise text stroke width of different sections is estimated by using global thresholding method, and this makes proper window sizes to be gained adaptively. Finally, the false contour is eliminated by combining with the optimized OTSU image. Experiments and analyses show that the misclassification rate of the foreground pixels caused by uneven text stroke width and different-sized characters is able to be reduced significantly by our approach.   Key Words: document image; binarization; local threshold; degraded images   文本图像二值化是光学字符识别(OCR)等任务中的一个重要而基本的处理过程,目的是准确地分割出图像中的前景和背景。尽管此问题已经过了长期研究,也提出了许多实用算法,但由于文本图像的多样性,尤其是存在着笔画不均、光照不均、污染以及因采集自古籍而使对比度变差等多种原因,迄今尚未找到一种普适的算法。鉴于问题的重要性,自2007年始,国际上连续举办了多届专门的文本图像二值化竞赛,以推动高质量的二值化算法研究[1-2]。   根据阈值的选择不同,二值化方法主要分为全局阈值法和局部阈值法两类,甚至还存在个别混合方法。其中,全局阈值仅用一个阈值将图像的前景与背景分割开,典型代表是OTSU(大津)法[3]。通常,在低对比度和光照不均的条件下,全局阈值法的抗噪能力表现较差。而对于退化的、质量较低的图像,局部阈值法则更为适用,根本原因在于可以通过当前像素点的局部邻域窗口动态计算合适的局部阈值。时下,存在诸多颇具实用性的局部阈值法,如Bernsen法[4]、Niblack法和Sauvola法等[5],这些算法分别采用邻域像素的最大值和最小值、邻域局部均值和局部标准差来计算阈值,尤其是Sauvola法考虑了前景像素的灰度值接近0而背景像素的灰度值接近255的特点。在近期的几次国际竞赛中,更有研究者提出了一些卓具实效的处理退化图像的局部阈值二值化方法[6-14]。诸如,Bolan Su、Shijian Lu等提出了基于背景估计和笔划宽度估计的二值化方法[6-7],Howe 提出了一种通过优化两个关键参数来改进二值化方法的技术[8],而Mesquita 等人则有针对性地提出了对一些算法进行融合和自动调节上述参数的有效可行方法[9]。这些算法在国际竞赛上提供的测试图像集上取得了良好效果,呈现了显著突出优势。

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档