手写数字识别的方法的研究.docVIP

下载本文档

25
0
约4.13千字
约 10页
2018-10-17 发布于福建
举报
版权申诉

手写数字识别的方法的研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

手写数字识别的方法的研究

手写数字识别的方法的研究　　摘要：提出了一种用BP神经网络识别手写数字的方法。论述了其良好的监督学习功能，并结合轮廓特征提取进行训练，给出了一种基于梯度下降法训练BP神经网络的手写数字识别方法。实验结果表明，该方法简单且有较好的识别效果。　　关键词：BP网络；手写数字识别；轮廓特征；梯度下降法　　中图分类号：TP317.4文献标识码：A文章编号：1672-7800（2012）012-0172-03 　　0引言　　手写数字识别是模式识别的一种，在学科上属于模式识别和人工智能的范畴。模式识别研究的内容是利用计算机对客观物体进行分类，在错误概率最小的条件下，使识别的结果尽量与客观物体相符合。　　一种经典的模式识别技术流程如图1所示，由数据获取、预处理、特征提取、分类决策及分类器设计5部分组成。一般分为上下两部分，上部分完成未知类别的模式分类；下部分属于设计分类器的训练过程，利用样品进行训练，确定分类器的具体参数，完成分类器的设计。而分类决策在识别过程中起作用的是对待识别样品进行决策分类。　　在手写数字的识别中，特征提取是其中很重要的一个环节。现有的手写特征提取算法有多种，最邻近模版匹配法、基于类中心的欧式距离法分类法、马氏距离分类法、夹角余弦距离分类法、最小错误概率的贝叶斯分类法、Fisher算法、BP神经网络分类法、RBF神级网络分类法等，还有各种现阶段的新型算法。　　本研究的基本内容主要是从BP神经网络仿真程序设计分类入手，运用BP网络分类器解决现实生活中经常涉及到的手写数字字符0～9的识别问题。　　1手写数字特征提取及识别方法　　1.1文献综述　　特征提取是整个字符识别系统的关键，识别算法是根据选取特征的种类来判断所选取的特征是否稳定，是否代表一类字符的特点，是系统识别率高低的关键。　　（1）结构特征。包括点、线、弧、圆等。结构特征可以描述数字的结构，对于字符的精细结构反应灵敏，该方法可以充分利用字符图形的结构信息及组成规律，减少笔画与字符型态变化的影响。结构法分辨相似字的能力较强。　　（2）统计特征。包括笔画密度特征、投影特征、面积特征、边缘特征、轮廓特征等，特点是易于训练，可降低书写随意性的干扰。　　（3）变换特征。可以分为二维的变换特征和一维的变换特征。常用的变换特征有Fourier变换、Hadanmand变换、Walsh变换、Rapid变换、Gabor变换、K-L变换、Wavelet变换。　　1.2手写特征模式识别方法　　本文采用的方法是先提取数字的轮廓特征，然后对图像进行裁剪之后按黑像素占总像素的比率提取出特征值。轮廓特征主要是指周边轮廓特征，即将数字字形加上外接矩形边框，然后分别从上、下、左、右四个方向依次扫描数字点阵直至碰到第一个黑像素或对面的边框为止，记录每次扫描所经过的白像素数，从而得到对应数字的四维特征向量，称为数字的周边轮廓特征，此特征稳定性较强，较易提取，维数较低，独立性较强。完成图像裁剪后，把每个数字图形定义成一个N*N（5*5）的模板，将每个样品的长度和宽度N等分，平均有N*N个等分，对每一等分进行像素个数统计，除以每一份的面积总数即得特征值。计算出第一行的5个比例值保存到特征的前5个，第二行对应着特征的6～10，如此保存样本的特征值。具体流程如图2所示。　　下面以0为例，简单描述求取特征值的方法。首先把图像按边缘裁剪放缩，然后分成5*5的小区域（如图3所示），再计算出每个小区域中黑像素所占的比例，存储之后即为0的一个样本特征值。　　2BP神经网络分类器的设计　　2.1BP神经网络训练过程论述　　BP网络结构有3层：输入层、隐含层、输出层，如图4所示。　　3层BP神经网络学习训练过程主要由4部分组成：输入模式顺传播（输入模式由输入层经隐含层向输出层传播计算）、输出误差逆传播（输出的误差由输出层经隐含层传向输入层）、循环记忆训练（模式顺序传播与误差逆传播的计算过程反复交替循环进行）和学习结果判别（判定全局误差是否趋向极小值）。具体实现如图5所示。　　下面具体介绍和分析用梯度下降法训练BP神经网络，在第1次输入样品（1=1，2，……，N）进行训练时各个　　参数的表达及计算方法。　　（1）确定参数。①输入向量为X=[x1，x2，…，xn]T（n—输入层单元个数）；②输出向量Y=[y1，y2，…，yq]T（q—输出层单元个数）；③希望输出向量O=[o1，o2，…，oq]T；④隐含层输出向量B=[b1，b2，…，bp]T（p—隐含层单元个数）；⑤初始化输入层至隐含层的连接权值Wj=[wj1，wj2，…，wjt，…，wjn]T，j=1，2，…，p；⑥初始化隐含层至输出层的连接权值Wk=[wk1，wk2，…，wkj，…，wkp]T，k=1，2，…，q。　　（2）