网站大量收购独家精品文档,联系QQ:2885784924

几种文本图像二值化方法的对比分析.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 23 卷第 1 期2011 年 3 月北 第 23 卷第 1 期 2011 年 3 月 北 方 工 业 大 学 学 报 J . N O R T H C H IN A U N IV . O F T EC H . Vol . 23 No . 1 Ma r . 2011 几种文本图像二值化方法的对比分析 3 童立靖 张 艳 舒 巍 占国亮 钱 垚 (北方工业大学信息工程学院 ,100144 ,北京) 摘 要 文档图像二值化是光学字符识别 ( OCR) 预处理阶段的关键技术 ,其处理效果的好 坏直接影响光学字符识别的识别率的高低. 本文对几种全局阈值算法与自适应局部阈值算法进 行了研究分析 ,从理论模型和实例文档图像两个方面综合分析了 O TSU 法 、迭代法 、简单统计 法 、Ber sen 、Niblack 、V FCM 、N FCM 等二值化算法. 通过实验、对比分析表明 ,几种算法各自具有 其优缺点 ,对一些复杂文档图像情况的适应性也各不相同. 在实际应用中 ,应根据具体的文档图 像质量、周围环境的光照 ,以及对图像处理时间的要求等情况选择合适的文档图像二值化算法. 关键词 文本图像 ;二值化 ;识别率 分类号 T P391 . 41 随着数码相机、工业摄像机等摄像设备的 普及 ,通过摄像设备获取文本图像就越来越普 遍 ,在此情况下 ,对历史文档和书籍图像处理就 越来越受到人们的重视 ,而文本图像二值化处 理在图像处理过程中起着非常重要的作用. 近 年来 ,国内外学者对文本图像二值化方法的研 究越来越关注[ 123 ] . 目前模式识别 、图像处理等技术已经进入 实用阶段 ,各种文本图像处理软件也正在迅速 发展. 文本图像二值化处理是一个涉及图像处 理、模式识别、图像分析和现有硬件等多个领域 的研究课题. 近 10 年来 ,文本图像二值化方法 尽管已经取得了一些成果 ,如基于文本扫描的 光照均匀的文本图像[ 4 ] ,但是 ,通过数码相机等 设备获取文本图像的过程涉及到很复杂的实际 问题 ,如图像获取设备的拍摄质量 、文字载体 (纸张) 的质量、文本图像获取时的环境等 ,这些 因素都会直接影响文本图像二值化的效果. 也 正是由于这些复杂情况所带来的挑战 ,通过数 码相机等设备获取的文本图像二值化方法成为 文本信息化领域的一个新的研究热点. 文本图像二值化是数字图像处理领域中较 为重要的一个方面. 在对文本图像进行处理的 过程中 ,许多系统均是以二值化的文本图像作 为基础. 通常情况下 ,首先对图像进行灰度化 , 之后对灰度化后的图像进行二值化 ,然后对二 值图像进行进一步加工与处理. 比如 O CR ( Op2 tical Cha ract er Reco gnitio n ) 就是对文本图像 做进一步的文字识别. 图像二值化的方法有很多种 ,每种方法都 有各自的优缺点 ,而对于同一幅图像 ,用不同的 二值化方法得出的阈值结果也不尽相同 ,从而 使得对二值化后的图像进行文字识别的识别率 也有高有低. 本文主要是选取一些主要的二值 化方法 ,并对文本图像进行处理 ,把处理结果进 行文字识别 ,从而识别对比与分析出对于文本 图像来说 ,在某些情况下一些二值化方法的处 理效果. 收稿日期 :2010210226 3“十一五”国家科技支撑计划重点项目( 2009BA I71B02) 、北京市属高等学校人才强教计划资助项目 ( P H 、北京市大学生 科学研究与创业行动计划. 第一作者简介 :童立靖 ,讲师. 主要研究方向 :数字图像处理、多媒体技术. 循环 2) - 4) 步 ,直到两组的平均灰度值不再发生新的变化 , 此时即获得了所需要 循环 2) - 4) 步 ,直到两组的平均灰度值不 再发生新的变化 , 此时即获得了所需要的阈 值[ 1 ,6 ] . 1 . 3 简单统计法 Kit t le r 等人提出一种基于简单图像像素 灰度梯度值与图像灰度统计相结合的阈值选取 方法. 简单统计法的基础是一种基于简单的图 像统计的阈值一次计算获取的方法. 当计算机 使用这种方法计算阈值时 ,阈值可以直接一次 计算得到 , 从而避免了多次迭代分析图像灰 度直 方 图 的 麻 烦. 该 方 法 所 使 用 的 计 算 公 式[ 1 ,7 ] 是 : 几种二值化方法的理论模型 1 对于常规文档图像 ,常使用 O TSU [ 5 ] 、迭代 法[ 6 ] 和简单统计法[ 7 ] 等方法. 对于文档光照不 均的情况 , 由于这一情况会对 O CR 识别引起 严重的影响 ,因此为处理文档光照不均 ,一些自 适应的二值化方法被提出 , 如 Ber se n[ 8 ] 、Ni2 black[ 9 ] 以及近年

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档