- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 23 卷第 1 期2011 年 3 月北
第 23 卷第 1 期
2011 年 3 月
北 方 工 业 大 学 学 报
J . N O R T H C H IN A U N IV . O F T EC H .
Vol . 23 No . 1
Ma r . 2011
几种文本图像二值化方法的对比分析 3
童立靖 张
艳
舒
巍
占国亮 钱
垚
(北方工业大学信息工程学院 ,100144 ,北京)
摘 要 文档图像二值化是光学字符识别 ( OCR) 预处理阶段的关键技术 ,其处理效果的好
坏直接影响光学字符识别的识别率的高低. 本文对几种全局阈值算法与自适应局部阈值算法进 行了研究分析 ,从理论模型和实例文档图像两个方面综合分析了 O TSU 法 、迭代法 、简单统计 法 、Ber sen 、Niblack 、V FCM 、N FCM 等二值化算法. 通过实验、对比分析表明 ,几种算法各自具有 其优缺点 ,对一些复杂文档图像情况的适应性也各不相同. 在实际应用中 ,应根据具体的文档图 像质量、周围环境的光照 ,以及对图像处理时间的要求等情况选择合适的文档图像二值化算法.
关键词 文本图像 ;二值化 ;识别率
分类号 T P391 . 41
随着数码相机、工业摄像机等摄像设备的
普及 ,通过摄像设备获取文本图像就越来越普 遍 ,在此情况下 ,对历史文档和书籍图像处理就 越来越受到人们的重视 ,而文本图像二值化处 理在图像处理过程中起着非常重要的作用. 近 年来 ,国内外学者对文本图像二值化方法的研 究越来越关注[ 123 ] .
目前模式识别 、图像处理等技术已经进入 实用阶段 ,各种文本图像处理软件也正在迅速 发展. 文本图像二值化处理是一个涉及图像处
理、模式识别、图像分析和现有硬件等多个领域 的研究课题. 近 10 年来 ,文本图像二值化方法 尽管已经取得了一些成果 ,如基于文本扫描的 光照均匀的文本图像[ 4 ] ,但是 ,通过数码相机等
设备获取文本图像的过程涉及到很复杂的实际
问题 ,如图像获取设备的拍摄质量 、文字载体 (纸张) 的质量、文本图像获取时的环境等 ,这些 因素都会直接影响文本图像二值化的效果. 也 正是由于这些复杂情况所带来的挑战 ,通过数 码相机等设备获取的文本图像二值化方法成为
文本信息化领域的一个新的研究热点.
文本图像二值化是数字图像处理领域中较 为重要的一个方面. 在对文本图像进行处理的 过程中 ,许多系统均是以二值化的文本图像作 为基础. 通常情况下 ,首先对图像进行灰度化 , 之后对灰度化后的图像进行二值化 ,然后对二
值图像进行进一步加工与处理. 比如 O CR ( Op2 tical Cha ract er Reco gnitio n ) 就是对文本图像 做进一步的文字识别.
图像二值化的方法有很多种 ,每种方法都 有各自的优缺点 ,而对于同一幅图像 ,用不同的
二值化方法得出的阈值结果也不尽相同 ,从而 使得对二值化后的图像进行文字识别的识别率 也有高有低. 本文主要是选取一些主要的二值 化方法 ,并对文本图像进行处理 ,把处理结果进 行文字识别 ,从而识别对比与分析出对于文本 图像来说 ,在某些情况下一些二值化方法的处
理效果.
收稿日期 :2010210226
3“十一五”国家科技支撑计划重点项目( 2009BA I71B02) 、北京市属高等学校人才强教计划资助项目 ( P H 、北京市大学生 科学研究与创业行动计划.
第一作者简介 :童立靖 ,讲师. 主要研究方向 :数字图像处理、多媒体技术.
循环 2) - 4) 步 ,直到两组的平均灰度值不再发生新的变化 , 此时即获得了所需要
循环 2) - 4) 步 ,直到两组的平均灰度值不
再发生新的变化 , 此时即获得了所需要的阈 值[ 1 ,6 ] .
1 . 3 简单统计法
Kit t le r 等人提出一种基于简单图像像素 灰度梯度值与图像灰度统计相结合的阈值选取 方法. 简单统计法的基础是一种基于简单的图 像统计的阈值一次计算获取的方法. 当计算机
使用这种方法计算阈值时 ,阈值可以直接一次
计算得到 , 从而避免了多次迭代分析图像灰 度直 方 图 的 麻 烦. 该 方 法 所 使 用 的 计 算 公
式[ 1 ,7 ] 是 :
几种二值化方法的理论模型
1
对于常规文档图像 ,常使用 O TSU [ 5 ] 、迭代
法[ 6 ] 和简单统计法[ 7 ] 等方法. 对于文档光照不 均的情况 , 由于这一情况会对 O CR 识别引起
严重的影响 ,因此为处理文档光照不均 ,一些自 适应的二值化方法被提出 , 如 Ber se n[ 8 ] 、Ni2
black[ 9 ] 以及近年
您可能关注的文档
- 基于三维激光扫描技术的土石坝变形监测方法研究.docx
- 基于生态策略的大学校园规划设计研究——以西北大学长安校区为例.docx
- 基于事故统计分析的城市轨道交通运营安全和可靠性研究.docx
- 基于手机的增强现实及其移动学习应用.docx
- 基于受众视角的汽车品牌校园推广模式.docx
- 基于数据仓库的决策支持系统.doc
- 基于数据仓库的矿山生产经营决策支持系统的应用研究.docx
- 基于数据库的动态路径寻优算法与实现.doc
- 基于数据挖掘技术的AFH客户分类应用研究.docx
- 基于数理分析的保险业道德风险研究.doc
- 2025年江苏省镇江市单招职业倾向性测试题库附答案.docx
- 二零二五年标识广告代理与发布合同.docx
- 2025年汕头职业技术学院单招职业适应性考试题库带答案.docx
- 2025年新疆克孜勒苏柯尔克孜自治州单招职业倾向性考试题库及答案1套.docx
- 二零二五年度车库车位租赁与共享停车服务合同模板.docx
- 2025年湖南环境生物职业技术学院单招职业适应性考试题库含答案.docx
- 2025年度供应链保密合作协议.docx
- 2025年江苏食品药品职业技术学院单招职业倾向性考试题库推荐.docx
- 2025年无锡商业职业技术学院单招职业倾向性考试题库及答案1套.docx
- 2025版[精选]企业间保密合作保密承诺书范本.docx
文档评论(0)