一种改进的文本图像二值化算法.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种改进的文本图像二值化算法 光学文本识别技术在许多领域得到了广泛应用,如车牌识别、信任文本识别等。对字符图像进行二值化是绝大多数字符识别系统所必需的过程, 近年来OCR工作者对此进行了大量的研究。根据取阈值的运算范围不同, 二值化方法可被分为全局阈值法和局部阈值法。 全局阈值法由文本图像的直方图或灰度的空间分布确定一个阈值, 并根据此阈值实现灰度文本图像到二值化文本图像的转化。此方法的优点在于算法简单, 但是由于对整幅图使用一个阈值处理, 因此对输入图像量化噪声和不均匀光照等情况抵抗能力差, 不能广泛地应用于实际。典型的全局阈值法包括Ostu方法、最大熵方法等。局部阈值法通过定义考察点的邻域, 由邻域计算模板实现考察点灰度与邻域点的比较。此方法不受非均匀光照条件等情况的影响, 较全局阈值法有更广泛的应用。典型的局部阈值法有Kamel-Zhao算法和Bernsen算法等。局部阈值法虽然能够根据局部灰度特性来自适应地选取阈值, 有较大的灵活性, 但是仍然存在缺点和问题, 如:实现速度慢, 字符笔画中出现断裂以及伪影现象 (ghost) (即在背景区域得到笔画结果) 。 本文将对上述局部阈值法中出现的问题及其原因进行分析, 并针对这些缺点提出一种改进的基于局部阈值的文本图像二值化方法。此方法以Bernsen算法为基础, 结合整体阈值, 并使用一种快速算法, 既克服了局部阈值法速度慢的缺点, 又不易受图像噪声和光照条件的影响。试验结果表明该方法是有效的、快速的, 适用于字符的识别预处理。 1 基于效率的bernsen算法 考虑以 (x, y) 为中心的 (2w+1) × (2w+1) 模板, f (x, y) 表示 处的灰度值, 则Bernsen算法可描述为: (x,(y)1)计算每点阈值 Bernsen算法的阈值由考察点邻域的灰度确定, 算法不存在预定阈值, 适应性较全局阈值法更广。这里假设字符笔画灰度大于背景, 当字符笔画灰度小于背景时, 可以先进行取反处理, 不影响算法作用。 2 有伪影现象、断裂现象 (1) 实现速度慢。由于Bernsen算法要寻找局部极大、极小值, 因此速度较慢。如果每次比较运算耗时一个单元时间, 则处理M×N图像耗时由M×N (2w+1) (2w+1) 决定。当局部窗口增大时, 对时间消耗的影响与窗口尺寸成平方关系。 (2) 有伪影现象。采用Bernsen算法时, 常常在背景区域出现伪笔画, 这叫做伪影现象。出现这种现象是因为Bersen算法以局部窗口内极大、极小值作为考察点的邻域, 当考察窗口内无目标点时, 个别噪声点将引起阈值的突变, 背景灰度的非均匀性也将影响局部阈值的变化, 从而使得本应是背景的点被二值化为目标点, 见图1。 (3) 有笔画断裂现象。当Bernsen算法考察窗口内均为目标点时, 局部阈值被拉升, 于是部分目标点被二值化为背景, 致使信息丢失, 从而出现笔画断裂现象, 见图2。 分析了造成Bernsen算法中种种缺点的原因后, 本文对Bernsen算法进行了一些改进, 最大程度上减少了伪影和字符断裂的出现, 并采用一种快速算法寻找局部窗口极值, 使得此方法更加具有实用价值。 3 阈值选取及改进 虽然全局阈值法由于自身的缺点, 应用受到极大限制, 但是它能够得到整幅图像的整体灰度特征, 因此在改进的算法中引入一点全局阈值的思想, 简单地得到一个整体阈值T1。算法的过程描述如下: (1) 为了消除个别灰度特异点, 首先算出一个阈值T1。取值满足hist[i]为原图灰度直方图, A为面积 (即图像像素总数) 。 (2) 计算各点阈值 这里是以点 (x, y) 为中心的大小为 (2w+1) × (2 w+1) 的窗口中的像素的极大值和极小值。为了提高算法的快速性, 采用文献中求取极值的算法。 (3) 为尽量避免伪影及笔画断裂现象的产生, 引入阈值T3, 用以确定局部考察窗口内极大与极小值的变化。 (4) 采用取平均值的滤波方法对阈值曲面进行平滑以消除光照不均等噪声所产生的阈值突变, 作为尽量避免伪影现象出现的另一手段, 改善二值化效果。引入另一阈值T4(x, y) 。 (5) 逐点二值化 则 上述方法考虑了文本图像背景噪声干扰、光照不均等情况, 又考虑了图像的整体灰度特性, 采用快速算法解决速度问题, 对局部阈值方法的Bernsen算法进行了改进, 克服了原来算法的缺点, 基本上消除了伪影及笔画断裂现象。 4 试验结果 以汽车牌照图像为例, 对Bernsen算法和本文算法进行了比较。试验结果如图3所示。 从以上试验结果来看, 图像用原来的Bernsen算法二值化后有明显的伪影, 非常不利于字符的识别, 而用本文的算法后, 伪影现象基本消除, 字符断裂情况也较少。 5 基于深度文本二值化的字

文档评论(0)

lczslgy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档