基于特征分类BP网络的手写体数字识别.pdfVIP

基于特征分类BP网络的手写体数字识别.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于特征分类BP网络的手写体数字识别.pdf

基于特征分类BP网络的手写体数字识别+ 余仲秋张猛耿西伟 信息工程大学理学院数理系郑州450001 摘要:本文提出了一种基于结构特征分类BP网gF的手写体数字识别新方法。首先,提取点、环等 数字特征值,并根据一些特征分类,然后运用BP神经网络识别,对于拒识字符再以统计特征识别,来 提高网络的识别能力。 关犍词:手写体数字识别结构特征神经网络 1引 言 、 Numeral 手写数字识glJ(Handwritten Character Recognition)是光学字符识别技术(optical Recognition,简称 ocR)的■个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。随着社 会信息化的发展,手写数字的识别研究有着重大的实用价值,如在邮政编码、税务报表、统计报表、财务报 表、银行票据、海关等需要处理大量字符信息录入的场合。 手写体数字识别方法大体可分为两类:基于统计的识别方法和基于结构的识别方法。第一类方法包括模 板匹配法、矩法、笔道的点密度测试、字符轨迹法及数字变换法等。第二类则是尽量抽取数字的骨架或轮 廓特征,如环路、端点、交叉点、弧状线、环及凹凸性等。一般来说,特征取得越多越好,或者说输入特征 向量的维数越高,对分类器的设计越是有利。当用一组特征做出来的分类器不能满足要求的话,自然就会 想到增加新的特征。但是,特征的增加同样也会增加特征提取的困难和分类计算的复杂性,甚至往往会发 现当特征的数目达到某个限度后,不但不能改善分类器的性能,反而使它的工作恶化,网络太大,很难收 敛,或者收敛到局部极小点。 手写体数字识别两类方法(基于统计的识别方法和基于结构的识别方法)具有一定的互补性。因此本文 使用了一个基于结构特征的分类识别器和一个基于统计特征的分类识别器,对这两个识别器的分类结果进 行组合可以获得较好的分类结果。 因此,我们要先对数字进行结构特征分类识别.对拒识字符进行二次识别,来降低网络的规模,提高识 别的效率。 2预处理 2.1一般的处理方法 对要识别的手写数字首先要进行预处理。预处理的主要目的是去除噪声、压缩冗余信息,得到规范化 的点阵,为特征提取做好准备。在预处理阶段,针对手写体字符的特点,对字符进行了较为完善的预处理, 包括二值化、梯度锐化、平滑去噪、分割、倾斜调整、断笔填充、小归一化、细化Ⅲ。 2.2特殊的处理 ‘作者简介:余仲秋,男,1964年出生,信息工程大学理学院数理系教授,主要研究方向为非线性光学、光学光栅及神经网络。 张猛,男,1980年出生,助教,主要研究方向神经网络。 138 计算机技术与应用进展·2006 2.2.1去除毛刺 经细化后的图像,由于噪声及笔道粗细的影响,会产生一些毛刺。检测端点与端点及端点与节点之间线段 的像素数目,若像素数目小于某一域值,则将此线段视为毛刺,予以去除。 2.2.2去除闭合环内的线段 对于数字而言,闭环内的线段对识别没任何意义。在细化后图像的基础上,去除这些线段。对于细化后的 数字图像,以区域生长法将其内环予以标记,然后检测各个端点,若某一端点的八邻域中有7点有同一内环标记. 则以此端点为起始点的线段必为闭环内线段口],可以将此线段去除。 2.2.3去除花饰环 闭合环的提取即检测数字中出现的圆环或椭圆。有许多种检测闭合圆,即提取检测数字中出现的圆环或 椭圆环的方法,这里采用在环中建立一个像素成员表的方法得到检测环,建立的链表的个数即为环的个数: 每一条链表的长度即为环内像素的个数,也就是环的质量o】。在许多字符图像中,发现数字中含有一种很小 的环,容易产生干扰称之为花饰环。通过设立一个阈值,来区分真正的环和花饰环区。如果环的质量低于 闽值,此为一个花饰环,去除环上除节点以外的点,这样花饰环中的四叉点(节点中c=4的点

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档