基于并行bp神经网络的数字识别.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于并行bp神经网络的数字识别 虽然只有10个手写符号,但它的构图是构成其他符号的基础。因此,识别方法可以扩展到复杂单词的识别。同时,手写数字识别系统也有实际应用,如编码、发票处理等。这些应用程序对识别的精度有很高的要求。因此,除了识别手写符号以外的数字外,对手写符号的研究还有实际应用。 由于神经网络具有自学习、容错性、分类能力强和并行处理等特点,对于识别手写体数字来说,采用神经网络是有效的手段.Pawlicki T F曾做过多层BP等多种神经网络用于识别手写体数字的试验,在比较试验结果后,证实多层BP网络的分类能力要比其他几种网络好.多层BP网络用于识别手写体数字可以采用两种形式:一种是通过一些算法,抽取字符特征,然后将一组特征值输入网络,利用神经网络对特征分类,达到识别字符的目的,这也叫作特征输入网络,它仅起分类作用;另一种是点阵(0,1点阵)直接输入网络利用网络来抽取特征并进行分类,这也叫作点阵输入网络.研究证明:对于识别手写体数字,特征输入网络要比点阵输入网络效果好,但特征输入网络的识别效果要取决于特征集的完备性,而要得到一个相对完备的特征集是非常困难的,要用大量算法并且消耗很多时间. 1 手写体数字识别系统的结构及流程 基于神经网络的手写体数字识别系统大致可以分为输入、预处理、特征提取、神经网络识别4个部分.输入包括数字样本集扫描输入和待识别数字输入,先用数字样本集扫描输入图像经预处理后特征提取的特征向量来训练神经网络,再用训练好的神经网络来识别待识别数字.预处理部分包括二值化、行字切分、平滑、去噪、细化,再对预处理后二值点阵图像进行特征提取,所提取的特征量如下节所示.最后将所提取的特征量输入训练好的神经网络进行识别,输出识别结果.基于神经网络的手写体数字识别系统的结构及流程如图1所示. 2 本文在此基础上提出了基于手动结构的数字几何结构的资源提取技术 2.1 文本图像的数字化 进行特征提取前先对手写数字进行了二值化、行字切分、平滑、去噪声、规范化(归一化)和细化等预处理,然后对其进行特征提取. 二值化采用全局阈值法.全局阈值法根据文本图像的直方图或灰度的空间分布确定一个阈值,并根据此阈值实现灰度文本图像到二值化文本图像的转化.行字切分采用投影法.图像点阵区域进行行(X轴)、列(Y轴)方向上的投影,分别得到横向和纵向的黑像素的统计直方图.字符点阵区域在直方图上呈现出波峰状,而字符间的空隙在直方图上呈现出波谷状.图像的细化操作采用模板匹配的方法,针对当前处理的像素点逐个与预设的模板比较,从而确定当前点的状态.归一化可分为线性归一和非线性归一两种方法.需要采用线性归一化.线性归一化就是将文字图像按比例线性放大或缩小为同一尺寸,算法简单,失真较小. 2.2 数字特征—特征选择 特征选择是至关重要的,其好坏决定着网络的规模与最终识别的效果,因此所选用的特征必须能充分反映字符的本质特征.对于手写体数字,所选用的特征提取方法对不同书写者造成的差异必须有较强的适应能力.数字是由弧线和直线构成的,弧线的弯曲方向和程度不同,字符形状不同.但同一类不同形状的字符,它的端点数及其方向,凸点数及其方向,三点数和四叉点数基本上是稳定的,而这些特征反映了数字的结构,是数字的重要特征.这里所采用的特征是:(1)端点数,端点方向及其位置;(2)凸点数,凸点方向及其位置;(3)三叉点位置;(4)四叉点位置. 设数字最多有 4个端点,6个凸点,1个三叉点,1个四叉点,这样形成 24个特征. 2.3 d0是端点三叉点 特征的提取是沿着轮廓点扫描的办法来实现的,起始点是按行扫描从上至下扫描找到的第一个特征点.为此,把被处理点d0连同它周围的 8个点构成1个 9点辅助阵,如图2. 当处理点d0 =1时,计算k=d1 +d2 +d3 +d4+d5+d6 +d7+d8.若k=1时,则d0是端点,其中有端点记为1,无端点记为0;k=2时,d0是一般连点或凸点;k=3时,d0是三叉点;k=4时,d0是四叉点.凸点是弧线段与垂直线的切点.根据弧线段与切线的相对位置,可将凸分为左凸点和右凸点两类 .若切线段在弧线左边,则为左凸点;切线段在弧线右边,则为右凸点.其中左凸点记为1,右凸点记为1/2,无凸点记为0.如图3特征点相对于字符的位置,我们是根据字符大小选择一个窗.这个窗刚好能框住字符,然后将这个窗分为16个小窗.所谓特征点的位置就是指特征点位于哪一个小窗内,各个小窗的位置编码如图4所示. 3 同的类别处理 采用多层 BP网来训练手写体数字,为了训练时收敛速度快且效果比较好,先采用了10个并行的单输出 BP网,每个网络对应一个数字.但是为了提高网络识别精度,对于同一个数字的多种不同手写体,如果形体差别(特指特征量)比较大的,在用神经网络进行识别的时候,先作为不同的类

文档评论(0)

182****8318 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档