- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
复杂背景图象字符特征检取方法的分析研究
摘要:复杂背景图象字符特征检取方法的研究,因存在背景纹理及颜色的不确定性、图像退化、字符缺损、字符种类多等众多不利因素,已成为当前字符特征检取研究中的难题;本课题主要对复杂背景图象下字符定位切割、字符特征提取方法作比较深入的研究,在以往研究基础上提出一种比较实用准确有效的检取算法,并以视频流图象帧背景下的中文字符特征检取为例,运用此检取算法建立一种系统的实现模型。
关键词:字符特征检取;磨损字符;图象退化
中图分类号:TP311文献标识码:A文章编号:1009-3044(2008)05-10ppp-0c
1 引言
目前字符图象的分割检取与识别技术受到广泛关注,已应用于多个研究领域如复杂目标定位、手写体和印刷体文字的识别等。然而对复杂背景图象中字符检取与识别研究,因存在背景纹理及颜色的不确定性、图像磨损退化、字符缺损、字符种类多等许多不利因素 ,已成为当前字符检取与识别研究中的难题。因此,对复杂背景图象字符检取与识别实用有效算法方面的研究,并建立该算法的系统实现模型,将有着非常广阔的应用前景与经济理论价值。
字符特征检取本质是一种目标定位,就是运用一定的方法提取目标的特征,并根据一定的准则将它们相互区别;在复杂的背景中字符区域往往只占图像的一小部分,特别是在字符区域字符磨损等不利因素影响的情况下,准确快速地切割与提取字符区域非常困难;目前,在字符图像分割、预处理、字符特征提取和识别等方面,国内外学者主要集中在一般字符图象的字符检取与识别方法的分析应用研究,它们对普通字符的字符检取识别率比较高,而对汉字字符检取识别率非常低,尤其在磨损字符的复杂背景图象中对中文字符的字符检取识别率更低,并且在原始字符点阵恢复方面的算法研究也甚少。基于上述这些情况,本课题主要对复杂背景图象下字符定位切割、字符特征提取方法作比较深入的研究,在以往研究基础上提出一种比较实用准确有效的检取算法,并以视频流图象帧背景下的磨损中文字符特征检取为例,运用此检取算法建立一种系统的实现模型。
2 字符定位、分割与特征提取方法概述
从复杂背景图象中提取字符,因图象的背景复杂且光照不均,对比度较低或模糊,给字符定位带来了很大的困难,在课题研究中提出了一种综合Canny算子作边缘检测、主动轮廓模型作图象局部分割和种子填充作可疑区评测相结合的字符区域定位方法。由于文字区域边缘比较丰富,使用Canny算子作边缘检测,得到图象的边缘图,然后在此图象进行水平扫描,进行纹理,再辅助以颜色分割,可得到图象中字符的可疑区域;在得到的可疑区域中检测出真正的字符区域,由于光照不均匀,以及不知道字符的灰度值所处的阈值范围,使得在使用以往的阈值分割很难适用各种复杂的情况,改进的主动轮廓模型局部分割可疑区域则由于对光照不敏感,可以取得很好的效果。分割出局部图象之后,再进行开运算,运用开运算中的膨胀运算可填充字符区域中的空洞,增加字符的连通性,腐蚀运算消除细小物体和在纤细处分离的部分,从而起到消除噪声和其他无用细节信号的作用,提高了定位字符区域位置的准确性;然后通过种子填充法作字符连通分析,生成许多小字符,作为判断可疑区域是否是真正的字符区域的一个最重要的指标,通过加以如可疑区域颜色是否相通,小字符长宽以及比例等判断指标,较可靠检测出真正的字符区域。
为了检取定位区域中的字符特征,必须将字符从字符区域中分割出来,字符的分割方法很多,其中最常用是基于投影分析的波峰―波谷法投影法,它对于规格比较统一、字符分离清晰的字符区域比较有效,但在实际问题中由于定位往往不能精确定位字符,使得分割出来的区域中包含其他背景,加上噪声干扰、光照不均或污染,会出现字符倾斜、字符粘连和断裂等现象,使得直接使用投影法很难达到理想的效果,在字符分割过程中运用了一种高效的基于极大方差的校正方法,有效地改进了传统的投影法,并综合了形态学与标志法相结合的字符切割方法,两种方法相结合进行字符切割,实验中取得了良好的效果。
字符特征检取是字符模式识别的一个重要环节,抽取稳定有效的字符特征是字符识别系统成功的关键。字符特征检取主要有两类方法:统计方法和结构方法,统计方法具有良好的鲁棒性,较好的抗干扰抗噪声、抗笔画的粘连与断裂等特性,它一般按一定的距离度量匹配准则,采用多维特征值累加的办法,把局部噪声和微小畸变淹没在最后的累加和中,但是它区分相似字的能力较差;而结构方法对结构特征较敏感,区分相似字的能力较强,但是结构特征难以抽取,不稳定。因字符具有二维结构,单纯用统计特征或者结构特征很难反映字符的特性,所以一种有效的字符特征应将统计特性与结构信息结合起来,将字符笔画的特性与字符背景特性结合起来,目前在字符检取与
文档评论(0)