冠字号识别.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
冠字号识别 此专为A类点钞机的人民币的冠字号而设计的识别方法。根据使用CIS采集图像及点钞机的运行特性,冠字号图像已在钞票走完后即完成冠字号图像部分的旋转及提取,已经转换为280*50的图像(所有票值的人民币都可正确提取),根据钞票字符的固有特性(笔画亮度、粗细、高度、间隔等)取出冠字号的二值化图像,下面只说明冠字号的识别。 分析:所有面值的钞票整个冠字号长度基本相同,约220点像素(需要根据钞票的倾斜角度进行校正);所有面值的钞票的最大高度一样(此高度通过电机的速度可算出字符在图像的像素点数);100元、50元的字体一样(50元线条更细点),字体中间最大,两边最小,同样高度及间距相应变化;20、10、5元的字体一样,都是前面4个字符中的两个字母高度最高,其余的高度一样;所要识别的字符都比较正;由于受电机速度和采集红外的影响,字符的横线比较容易模糊甚至断笔(特别是50元以下); 总体思路:识别的字符只限于26个大写的英文字母和10个0~9的数字,字符比较固定(以后的版本一般也是这些字符),字体也相对比较固定,用分类法识别加上每个字符的固有特性,用一个或多个特征把字符由大类分成小类,直到分出所有字符;由于字符大小及间距都已经确定,可利用笔画特征进行分类,分类法对于哪里出错一目了然,程序维护更加容易;这样点钞机可真正做到分级把控(前面的程序已经做到分级,如,图像采集-角度计算-正反面判断-冠字号图像定位-冠字号图像提取-字符定位-字符切分-二值化图像等),分类法可大大避免特征的重复计算,针对性更强。 完全基于字符特征的字符识别 考虑到人民币冠字号字符笔画中横竖特征比较明显的这一特征,通过笔画的横竖特征能在一定程度上划分字符集,但常用的方法都是先判断字符的笔画是否有横或者竖,而未综合横竖两个特征来进行字符集的初步划分,这样划分得到的字符集往往都是不太理想的,本文采用方法是利用特征向量记录下横竖特征,然后根据特征向量来进行字符集的初步划分,能得到划分比较理想字符集。最后再根据每个字符集中所包含的字符进一步利用字符特征来进行所有冠字号的识别。本法的流程图如图29所示: 图29 完全基于字符特征的字符识别 流程图相关说明: (1)字符“1”和“I”的判断(不考虑1元的)。直接用字符宽度来鉴别;鉴于05版面额50元、100元的“1”上边有“帽”,99版的和50元以下的这两个字符字体一样。无“帽”的情况下,若字符位于冠字号第二位,则是“I”,若是第三位,则看第二位识别的结果。类似的“0”和“O”也如此判断。当有断笔情况发生时,别的字符也有可能宽度太小的情况,如7、T、J、L,甚至Y也有可能,所以判断这两个字符时,也需要判断其竖线特征及还有没有别的特征; (2)特征向量为一个字节,高4位表示竖线特征,取值为0到7,分别代表:第4位左竖线、第5位代表中竖线、第6位代表右竖线;低4位代表横线特征,取值为:第0位上横线、第1位代表中横线、第2位代表下横线。 根据横竖特征组合初步划分的字符集如表1所示。 特征值 描述 字母 数字 00 无竖线,无横线 A、W、X、Y X1 只有上横线 T 1 7 X2 只有中横线 H X3 有上、中横线 F P R S X4 只有下横线 A L U 2 4 X5 有上、下横线 C D G O Q Z 0 2 3 X6 有 中、下横线 X7 有上、中、下横线 B E 3 5 6 8 9 1X 只有左竖线 A C E F G K L P R 2X 只有中竖线 I J T Y 1 7 3X 有左、中竖线 W 4X 只有右竖线 A J 2 3 4 5X 有左、右竖线 B D G H N M O Q U W 0 5 6 8 9 6X 有中、右竖线 W 7X 有左、中、右竖线 M W 表1 初步划分字符集 从表中可以看出同一个字符由于倾斜、噪音等因素的影响,可能出现不同的特征。上表是通过对一定量的图片进行仿真划分得到的字符集,从表中可以看出初步划分的字符集还是比较理想的。 识别到每个字符。其中除了根据特征,还得结合位置来进行识别,所谓根据位置识别则是利用了冠字号的特征,由于目前05版纸币仅有二冠号和三冠号,所以字母仅可能出现在前三位,且第一位必定为字母,后七位必定为数字,第二位和第三位可能为字母,也可能为数字;通过特征识别会有一定的误识别,因此通过结合位置识别来提高识别率。具体到每个字符集的划分,利用特征如下(步骤比较多的结合以流程图说明):

文档评论(0)

linyin1994 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档