- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于BP网络的数字图像识别
陈婷
摘要:介绍了字符识别的几种方法及神经网络的基本原理,并将BP神经网络应用于数字识别。通过Matlab采集数字的图像,并进行样本训练,实现了基于BP神经网络的数字识别。仿真试验结果表明,BP神经网络可以对阿拉伯数字进行快速、准确的识别,具有广泛的应用前景。
关键字:BP神经网络;数字识别;图像
引言
数字字符识别[1](NumeralRecognition)是光学字符识别(OpticalCharacterRecognition,OCR)技术的一个重要分支。在大规模数据统计,邮件分拣,汽车牌照、支票、财务、税务、金融等有关数字编号的识别方面得到广泛应用,因此成为多年来研究的一个热点。而人工神经网络(ArtificialNeuralNetworks,简称ANN)具有良好的容错能力、强大的分类能力、自适应和自学习等特点,备受人们的重视,在字符识别领域得到了广泛的应用。
用ANN进行字符识别主要有两种方法:一是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器。这种网络的识别效果与字符特征提取的完备性有关;二是充分利用神经网络的特点,直接把待处理的图像输入网络,由网络自动实现特征提取直至识别。这种网络的识别速度与输入的待处理图像大小有关[2]。
本文采用的是第二种方法,并运用BP网络进行数字字符识别。
BP神经网络的基本原理
BP神经网络是一种典型的前馈神经网络[3],其网络的基本结构如图1所示,BP算法属于有监督式的学习算法,其主要思想是:输入学习样本,使用反向传播算法对网络的权值和偏差进行反复的调整训练,使输出的向量与期望向量尽可能地接近,当网络输出层的误差平方和小于指定的误差时训练完成,保存网络的权值和偏差。
图1BP神经网络结构图
3.数字识别
3.1图像预处理
利用BP神经网络对阿拉伯数字进行识别前,应先对阿拉伯数字位图样本进行预处理[4],即先将256色位图转为灰度图,然后二值化,最后进行归一化处理,以消除各数字在位置和大小上的差异,从而提高识别的准确率。归一化处理后的字符便可进行特征向量提取。将所提取的特征输入到神经网络进行识别,最后输出并显示识别结果,过程如图2所示。
图2数字识别的基本原理
因为本文主要是研究BP网络在数字识别中的应用,所以在提取数字特征时,人为限定了数字灰度图的大小,这样就避免进一步消除数字在位置和大小上的差异。
3.2BP神经网络设计
由于具有偏差和至少一个S型隐含层加上一个线性输出层的网络,能够逼近任何函数,所以采取具有一个隐含层的BP网络[5]。网络的输入、输出应根据应用的具体要求来设定。输入层节点数目取决于数据的维数,采用的输入数据为已经提取的特征数据,输入特征数据为24×17的矩阵,转换成408×1的矩阵,因此神经网络输入神经元数目为408。本文为了节省工作量仅对单个数字进行训练及识别。对应于“0”的特征输入,输出即得到“0”,其他数字也是如此。如果要同时识别0~9这10个数字,可以采用8421码来识别,即对于输出“0”,采用(0,0,0,0)主要的目标向量来表示,对于输入“1”,采用(0,0,0,1)这样的输出向量来表示,…,对于输入“9”,采用(1,0,0,1)这样的输出向量来表示,以此类推。所以在这里本文的输出层神经元数目为1,也即输出向量的维数,如果采用后者,输出层神经元数目为4。本文对每个数字采用8组样本进行训练,4组进行测试,如图3所示,前8组训练用,后4组测试用。
图3测试数据示意图
3.3BP神经网络训练与测试
使用函数newff创建一个两层网络,网络有408个输入,1个输出神经元,隐含层选取30个神经元。第一层的激励函数是“TANSIG”,第二层的激励函数是“PURELIN”。学习函数是梯度下降动量学习函数LEARNDM,训练性能函数为平方和误差“MSE”,这里使用函数“TRAINRP”进行训练,输入范围选择输入变量自动填入,创建网络如图4所示。
图4BP网络创建图
通过VIEW按钮可以看到所创建网络的结构图如图5。
图5BP网络结构图
之后对网络进行训练,图6显示的是对数字“1”的训练效果图,从图中可以看出在训练到50步时,系统已经收敛(尽管波形不是很光滑),总残差目标为3.27254e-15,Goal为0。
图6BP网络训练效果图
图7是训练网络之后得到的输出以及误差,可以看到误差很小,训练效果很好。
图7网络训练输出及误差显示
最后要进行网络测试,输入测试样本与输出目标后进行Simulate,得到图8所示的输出与误差,可以看到,测试结果是完全正确的,误差几乎为0,所以能够达到期望的结果。
图8网络测试结果输出与误差
结语
通过对BP网络进行分
您可能关注的文档
- 量子力学第二章.ppt
- 高三公开课-等差数列定义及性质.ppt
- 高等数学随堂讲义高等数学第七版概率论.pptx
- 马克思主义科学技术观.ppt
- 降低化学反应活化能的酶课件.ppt
- l绿色化学的发展.doc
- 高二物理光的折射赛教课件.ppt
- 高三政治(坚持两点论和重点论的统一).ppt
- 青稞红曲介绍.ppt
- 钻井工程第六章.ppt
- DB44_T 2607.4-2025 滨海蓝碳碳汇能力调查与核算技术指南 第4部分:盐沼.pdf
- DB43_T 3178-2024 烟叶农场建设管理要求.pdf
- DB37_T 4838-2025 含氢分布式综合能源系统运行优化指南.pdf
- DB37_T 4834-2025 高速公路集中养护工作指南.pdf
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
最近下载
- 文职技能岗工程机械维修试题.doc VIP
- 2024年江西·农商银行员工招聘真题.docx VIP
- 仪器名称:长春迪瑞 H-300 尿液分析仪型号: H-300.pdf VIP
- 2024年江西农商银行员工招聘真题.docx VIP
- 2023年广东工业大学软件工程专业《操作系统》科目期末试卷A(有答案).docx VIP
- 2024年江西·农商银行员工招聘笔试真题.docx VIP
- 人卫九版心血管PPT:第二章 心力衰竭.ppt
- 历年江西农商银行员工招聘笔试真题2024 .docx VIP
- 2024年江西•农商银行招聘真题.docx VIP
- 【人教版】四年级上册数学课件《平行与垂直》(共20张PPT).pptx
文档评论(0)