车牌汉字识别的方法的研究.docVIP

下载本文档

2
0
约3.39千字
约 8页
2018-11-06 发布于福建
举报
版权申诉

车牌汉字识别的方法的研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

车牌汉字识别的方法的研究

车牌汉字识别的方法的研究　　摘要:汉字识别属于模式识别的范畴。通常的汉字识别方法可分为两类:一是基于汉字结构(笔画特征)的结构识别;一是基于汉字统计特征的统计识别。但他们各有优缺点。本文主要探讨了目前主要的车牌汉字识别方法，为汉字识别的实际应用打下基础。　　关键词:车牌汉字;汉字识别　　　　一、引言　　　　文字是人类思想的载体，是交流的工具。进入信息时代后，原来依靠图形记载在纸上的文字有了电子化的以序号为代表的记载方式。这就产生了图形文字与编码序号之间的转换问题。由编码序号到文字图形是计算机输出，而由文字图形到编码序号就是文字识别。文字识别是模式识别的一个重要研究方向，在办公自动化、快速信息处理、机器视觉等多方面有着重要的理论意义和实用价值。　　近年来，随着国内经济的快速增长，汽车工业和交通运输产业迅速发展，对智能交通系统提出了更高的要求，包括移动车辆稽查、高速公路收费站管理、停车场(小区)车辆管理等在内的一系列智能管理系统应运而生。在上述智能系统中，字符识别都是其核心内容，而汉字识别(Chinese Charaeter Recognition， CCR)又是字符识别的重点和难点所在。如何进一步提高汉字的识别率，降低拒识率和误识率，提出有针对性的汉字识别解决方案，仍有许多工作要做，这也正是本文对汉字识别方法进行研究的目的所在。　　　　二、车牌汉字识别方法　　　　汉字识别属于模式识别的范畴，通常的汉字识别方法可分为两类:一是基于汉字结构(笔画特征)的结构识别;二是基于汉字统计特征的统计识别。结构模式识别方法的优点是可以识别复杂的模式，缺点是需要进行笔画提取。在统计模式识别方法中，特征提取方便，识别速度与识别对象无关，但需要得到汉字集的稳定特征，且在汉字笔画较多时要求的特征量非常巨大。从一般应用来看，二者各有优缺点。　　具体说来汉字识别方法常用的有模板匹配法、统计特征匹配法、人工神经网络识别法等。　　（一）模板匹配法　　这个方法是把输入的字符直接和标准的字符原型进行比较，找到与之最匹配的模板。模板匹配对噪声、倾斜、形变等因素影响很敏感，而且对字符的字体风格不具有适应性。但考虑到车牌中出现的汉字的有限性(一般有四十多个汉字)，仍然可以考虑构建标准汉字模板库来进行模板匹配。但在实际研究中我们发现，二值化的图形模板虽然直观，但其匹配计算过程过于简单直接，对倾斜、形变、残损、模糊的待识别字符匹配误差较大，因此鲁棒性较差。而灰度模板由于色彩、光照等因素影响，难以找到普遍适用的模板形式实现直接的匹配计算。在此基础上提出的基于二值图形变动分析的模糊模板匹配方案，可以获得更好的识别效果。下面做一简单介绍。　　首先，选取图像质量较好的汉字，规格化为17×34像素的标准大小并完成二值化，归类保存。然后，将归类的多幅二值图形对齐后叠加，再标难化，形成模板库。　　进行匹配识别时，对一幅切分后的待识别汉字灰度图，先将其规格化为17×34像素的标准尺寸，然后，将各象素点的灰度值线性变换到[0，1]区间，再与模糊图形模板匹配，计算Manhattan距离或Euchd距离，其最小距离值对应的模板汉字即为匹配识别输出的结果。　　该方法的优点是不用对灰度图像作二值化处理，避免了由于二值化带来的图像信息损失。特别是对一些模糊图像，若直接二值化，效果较差，影响匹配准确度。对于原始图像明暗程度不同的图像，其平均值与对应模板的平均值并不一致，直接用Manhattan距离或Euclid距离进行匹配，会带来较多的计算误差。因此，可以考虑引入归一化的相关性度量公式，避免由于明暗和对比度变化导致图像和模板的“能量”不一致带来的匹配误差，进一步提高匹配准确度。　　（二）统计特征匹配法　　汉字的统计模式识别将字符点阵看作一个整体，从这个整体上经过大量统计得到所用特征，用尽可能少的特征模式来描述尽可能多的信息，抗干扰性强，在实际应用中使用率较高。　　根据所提取特征的类型，特征统计的方法有下面几种: 　　(a)整体变换分析法:对字符图像进行二进制变换(如walsh，Hadamard变换等)或更复杂的变换(如Fourier，Hough变换等)，变换后的特征维数大大降低。但这些变换不是旋转不变的，对于倾斜变形的字符识别会有较大偏差。二进制变换虽然计算简单，但没有明显的物理意义。复杂的变换通常运算量太大，难以实用。　　(b)几何矩(Geometric Moment)特征。利用矩不变量，统计多个矩作为特征，进行匹配识别。但移不变、比例不变的几何矩只在线性变换下成立，实际环境中，很难保证线性变换这一前提条件。　　(e)Spline曲线拟合与傅立叶描绘子(Fourier Descriptor)特征。这两种方法都是