基于BP网络的手写体数字图片特征提取.docVIP

基于BP网络的手写体数字图片特征提取.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于BP网络的手写体数字图片特征提取.doc

基于BP网络的手写体数字图片特征提取   摘 要:本文主要研究了手写体数字的识别问题,选用了300组像素为的手写体图片,对其先进行归一化处理,之后提取了图像的7个不变矩(Hu矩)特征、均值、方差以及图像的字符势能,以它们作为图像的特性,用BP网络进行识别,识别效率达到80%以上。   关键词:归一化;Hu矩;字符势能;BP网络   DOI:10.16640/j.cnki.37-1222/t.2016.11.205   1 引言   手写体数字识别的研究,有助于考古学的发展,为考古某些缺失文字的识别奠定了一定基础。识别效率的高低是我们最为关心的问题。本文为了提高识别的正确率,选用了识别性能很好的BP网络。在图片处理方面,先进行了归一化,之后对归一化的图片提取了图片的Hu矩[1]、字符势能[2],用这些作为BP网络的识别对象,而不是直接去识别图像,缩小了识别对象的大小,并且掌握了对象的特征,识别更为快捷准确。   2 图像的处理过程   本文中,这些手写体图片都是在电脑XP系统的画图工具人为输入的。图像的大小都是。由于输入时,图片在所输入区域的位置不一样,图片本身的大小也存在差别,这些都对识别的结果有直接的影响。所以,本文就这两方面做了改进。具体的做法是,先提取图片数字的边缘,即数字的最左、最右、最上、最下的边界点,这样就把图片的数字区域提取出来了,之后把它扩大成我们需要的尺寸。这样数字的大小是一样的。然后再将这些数字部分放在我们固定大小的模板上。对图像做了这一系列的处理后,每个图片的大小是一样的,而且有数字的部分的大小也是一样的。   3 BP网络   BP网络是一种按误差逆传播算法训练的多层前馈网络[3],是目前应用最广泛的神经网络模型之一。BP网络能学习和存储大量的输入输出―模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法[4],通过反向传播来不断调整网络的权值和阀值,使网络的误差平方和最小。BP网络模型拓扑结构[5]包括输入层、隐含层和输出层。   4 Hu矩,字符势能   4.1 Hu矩   Hu矩主要用到了2个不变矩作为矩特征,矩特征主要表征了图像区域的几何特征,又称为几何矩,由于其具有旋转、平移、尺度等特性的不变特征,所以又称其为不变矩。在图像处理中,几何不变矩可以作为一个重要的特征来表示物体,可以据此特征来对图像进行分类等操作。   由Hu矩组成的特征量对图片进行识别,优点就是速度很快,缺点是识别率比较低,我做过手势识别,对于已经分割好的手势轮廓图,识别率也就30%左右,对于纹理比较丰富的图片,识别率更是不堪入眼,只有10%左右。这一部分原因是由于Hu不变矩只用到低阶矩(最多也就用到三阶矩),对于图像的细节未能很好的描述出来,导致对图像的描述不够完整。   4.2 字符势能   投影能表现图像的某种特征信息,指定方向上单条前景像素的个数。本文主要做了垂直方向的势能和水平方向的势能。   垂直方向的势能,主要是记录图片的水平投影和垂直投影。本文所用的图片是最简单的黑白图片,这样的图片用矩阵表示只有0、1两种数字,黑色部分用1表示,白色部分为0.垂直方向的势能,记录的是图片中1所在的行标,图片中0的部分投影过来也用0表示。垂直方向的势能中的水平投影是投影过来的矩阵每行的和,垂直投影则是每列元素的和。水平方向的势能是记录的是图片中1所在的行标,图片中0的部分投影过来也用0表示。水平方向的势能中的水平投影是投影过来的矩阵每行的和,垂直投影则是每列元素的和。这样我们就得到了图片的字符势能。   5 识别结果   把图像归一中心化后,我们分别提取图片的Hu矩、均值、方差、字符势能,把这些量合到一起作为BP网络的输入量,用BP网络进行识别,表1是我们统计的识别结果。   从表1中可以看出,识别的正确率还是不错的。只有数字5的识别正确率较低   参考文献:   [1]丁兴号,邓善熙.Hu矩和Zernike矩在字符识别中的应用[J].工具技术,2003(03).   [2]Bo Li, De-Shuang Huang, Chao Wang, Kun-Hong Liu. Feature extraction using constrained maximum variance mapping[M]. Pattern Recognition. 2008,Volume 41.Pages:3287-3294.   [3]魏国辉,孔英,李庆玲.反向传播网络与径向基网络函数逼近的仿真比较[J].济宁医学院学报,2011.   [4]从爽,面向MATLAB工具箱的神经网络理论与应用.3版.合肥:中国科学技术大学出版社,2003:64-158.   [5]

文档评论(0)

ganpeid + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档