- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于BP神经网络的多样本手写体字符识别
基于BP神经网络的多样本手写体字符识别 摘要:手写体字符识别是人机交互领域的一个重要内容,本文基于BP神经网络实现了任意数量字符模版的多字符手写体字符识别。分为以下几步,第一,首先对目标图像进行识别前预处理。包括灰度图像二值化、图像孤立像素滤波、图像膨胀、腐蚀、按字母最小行分割、按字母最小列分割、图像紧缩、归一化等;第二,用处理好的多个样本进行BP神经网络训练。包括BP网络参数的选择、目标结果构建、输入到结果的映射即用样本库进行神经网络学习机的训练;第三,待测字母的识别。包括对图像预处理、字符提取、归一化和送入已训练好的BP网络进行识别。该系统最终实现了95%以上的手写字符识别正确率,有一定的借鉴意义
关键词:模式识别;BP神经网络;手写体字符识别;图像分析
引言
在当前MATLAB神经网络字符识别研究中,一般都是基于单个字符库样本进行学习机训练而且很少进行手写字符的识别,例如应用最多的车牌字符识别,其送人的训练样本一般很有限,因此学习样本有限,很难适用于具有广泛特性的手写字符识别,因此,对于多种不同手写样本的训练和识别有一定的研究意义。具体实现功能描述如下,首先利用不同笔迹书写的字母训练BP神经网络学习机,然后用手写的样本测试BP学习机的识别正确率,要求输入各个字母的训练样本库和测试用的手写字母库,程序给出最终的识别结果和识别正确率
1基于Matlab的手写字符识别系统
基于Matlab的手写字符识别系统由以下模块构成,包括图像预处理、字符有效区域检测、图像分割、样本库训练和测试字符识别,如图1
其中,原始图像:由数码相机或其它扫描装置拍摄到的图像;
图像预处理:对动态采集到的图像进行滤波、边界增强等处理以克服图像干扰;
字符分割、归一化:利用梯度检测的字符定位、分割方法得到单个的字符,并将所有字符归一化为固定大小;
样本数据库:利用前期采集的每个字母80个的手写字符为第5步的字符识别建立字符模板数据库;
BP学习机:根据样本数量和训练分类结果构建BP学习机:
字符识别:基于人工神经网络的OCR算法,通过特征对比或训练识别出相关的字符,得到最后的英文字符识别结果
2BP神经网络的字母识别
2.1图像预处理
图像在形成、传输或变换过程中,受多种因素的影响,如:光学系统失真、系统噪声、曝光不足或过量、相对运动等,往往会与原始景物之间或图像与原始图像之间产生了某种差异,这种差异称为降质或退化。因此在图像处理之前必须进行预处理,包括去除噪音、边界增强、增加亮度等等
以字母q的样本库图2为例,实验素材是数码相机拍摄的手写字母q的各种不同形式,但由于手写体比较自由的特点,因此有了许多形态不尽相同的字母q的类,通过观察发现,不同类型字母q由于手写速度不同造成部分字母出现部分线条断裂,另外由于字母灰度图存在部分干扰,为了消除以上缺陷,先将图像进行灰度二值化并滤除一些孤立背景噪声,其次再对图像做膨胀和腐蚀运算使得图像中断裂的线条重连使用的样本库均类似图3
经过预处理的图像含有很少的噪声,并且图像特征得到增强,后面将会对预处理过的图像进行分割操作
2.2字母定位
经过预处理,可以更加清晰的发现字母图像基本是按照水平和垂直的行和列分布,因此先将图像分隔成包含每8个字母的分行图像。按照以下方法来进行行分割。通过和列像素点统计相类似的办法可以得到行的像素点统计分布。统计完成绘制的像素点统计分布图如图4其中图像横坐标是图像的行列的绝对像素位置
根据所得的结果很容易确定每行字母的其实行(列)和终止行(列),通过检测梯度刚开始上升的位置则为行开始位置,梯度下降末的位置则为图像的行(列)终止的位置。通过该算法进行行(列)位置的确定
2.3字母分割
根据上面提供的算法已分别将上升沿、下降沿位置信息存储到了hang up和hang down数组中,下面将整个图像分隔成单行,算法思想是新建图像空间,分别搜素图像自像素行hang up(1)到hang-down(1)位置的所有行,将其复制到新的图像空间。这样便完成了图像的行分割,如图5。同理我们可采取同样的思想将分割后的行图像进行统计,然后记录上升沿和下降沿的位置信息,再扫描上升沿到下降沿的所有列并存储到新的图像空间,这样就完成了图像的列分割,从而完成字母单独分割。同样原理实现列分割的效果如图6
2.4字母图像归一化
考虑到为避免后期进行目标识别时由于大小而引起的误差,因此应将单个字符图像进行归一化,此外为方便起见,前期分配临时存储空间时,采用了固定的图像空间大小,因此由于分配的图像的存储空间一般大于字母,所以会造成空间的浪费,所以我们还要对图像进行去空白区域操作,思想是由顶行逐行向底行搜索,统计
您可能关注的文档
最近下载
- 曼隆电梯MEP电气原理图.pdf VIP
- 防治荒漠化公约-unitednationsconventiontocombatdesertification.pdf VIP
- 苏教版4年级上册数学试卷.doc VIP
- 曼隆电梯MEP原理图NICE3000电气原理图纸SDA7700B.pdf
- 通风与空调工程专项施工方案(最全).doc VIP
- 色素痣诊疗专家共识(2025版)解读 PPT课件.pptx VIP
- 小学英语语法课件- 一般将来时 (共36张PPT) 全国通用.ppt VIP
- 个人简历模板表格求职简历模板表格.docx VIP
- 血管炎肾损害.ppt VIP
- COC七版半自动人物卡v2.0.4(通用).xlsx VIP
文档评论(0)