基于BP网络的手写体数字图片特征提取.docVIP

下载本文档

8
0
约2.11千字
约 4页
2017-02-13 发布于北京
举报
版权申诉

基于BP网络的手写体数字图片特征提取.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于BP网络的手写体数字图片特征提取.doc

基于BP网络的手写体数字图片特征提取　　摘要：本文主要研究了手写体数字的识别问题，选用了300组像素为的手写体图片，对其先进行归一化处理，之后提取了图像的7个不变矩（Hu矩）特征、均值、方差以及图像的字符势能，以它们作为图像的特性，用BP网络进行识别，识别效率达到80%以上。　　关键词：归一化；Hu矩；字符势能；BP网络　　DOI：10.16640/j.cnki.37-1222/t.2016.11.205 　　1 引言　　手写体数字识别的研究，有助于考古学的发展，为考古某些缺失文字的识别奠定了一定基础。识别效率的高低是我们最为关心的问题。本文为了提高识别的正确率，选用了识别性能很好的BP网络。在图片处理方面，先进行了归一化，之后对归一化的图片提取了图片的Hu矩[1]、字符势能[2]，用这些作为BP网络的识别对象，而不是直接去识别图像，缩小了识别对象的大小，并且掌握了对象的特征，识别更为快捷准确。　　2 图像的处理过程　　本文中，这些手写体图片都是在电脑XP系统的画图工具人为输入的。图像的大小都是。由于输入时，图片在所输入区域的位置不一样，图片本身的大小也存在差别，这些都对识别的结果有直接的影响。所以，本文就这两方面做了改进。具体的做法是，先提取图片数字的边缘，即数字的最左、最右、最上、最下的边界点，这样就把图片的数字区域提取出来了，之后把它扩大成我们需要的尺寸。这样数字的大小是一样的。然后再将这些数字部分放在我们固定大小的模板上。对图像做了这一系列的处理后，每个图片的大小是一样的，而且有数字的部分的大小也是一样的。　　3 BP网络　　BP网络是一种按误差逆传播算法训练的多层前馈网络[3]，是目前应用最广泛的神经网络模型之一。BP网络能学习和存储大量的输入输出―模式映射关系，而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法[4]，通过反向传播来不断调整网络的权值和阀值，使网络的误差平方和最小。BP网络模型拓扑结构[5]包括输入层、隐含层和输出层。　　4 Hu矩，字符势能　　4.1 Hu矩　　Hu矩主要用到了2个不变矩作为矩特征，矩特征主要表征了图像区域的几何特征，又称为几何矩，由于其具有旋转、平移、尺度等特性的不变特征，所以又称其为不变矩。在图像处理中，几何不变矩可以作为一个重要的特征来表示物体，可以据此特征来对图像进行分类等操作。　　由Hu矩组成的特征量对图片进行识别，优点就是速度很快，缺点是识别率比较低，我做过手势识别，对于已经分割好的手势轮廓图，识别率也就30%左右，对于纹理比较丰富的图片，识别率更是不堪入眼，只有10%左右。这一部分原因是由于Hu不变矩只用到低阶矩（最多也就用到三阶矩），对于图像的细节未能很好的描述出来，导致对图像的描述不够完整。　　4.2 字符势能　　投影能表现图像的某种特征信息，指定方向上单条前景像素的个数。本文主要做了垂直方向的势能和水平方向的势能。　　垂直方向的势能，主要是记录图片的水平投影和垂直投影。本文所用的图片是最简单的黑白图片，这样的图片用矩阵表示只有0、1两种数字，黑色部分用1表示，白色部分为0.垂直方向的势能，记录的是图片中1所在的行标，图片中0的部分投影过来也用0表示。垂直方向的势能中的水平投影是投影过来的矩阵每行的和，垂直投影则是每列元素的和。水平方向的势能是记录的是图片中1所在的行标，图片中0的部分投影过来也用0表示。水平方向的势能中的水平投影是投影过来的矩阵每行的和，垂直投影则是每列元素的和。这样我们就得到了图片的字符势能。　　5 识别结果　　把图像归一中心化后，我们分别提取图片的Hu矩、均值、方差、字符势能，把这些量合到一起作为BP网络的输入量，用BP网络进行识别，表1是我们统计的识别结果。　　从表1中可以看出，识别的正确率还是不错的。只有数字5的识别正确率较低　　参考文献：　　[1]丁兴号，邓善熙.Hu矩和Zernike矩在字符识别中的应用[J].工具技术，2003（03）. 　　[2]Bo Li， De-Shuang Huang， Chao Wang， Kun-Hong Liu. Feature extraction using constrained maximum variance mapping[M]. Pattern Recognition. 2008，Volume 41.Pages：3287-3294. 　　[3]魏国辉，孔英，李庆玲.反向传播网络与径向基网络函数逼近的仿真比较[J].济宁医学院学报，2011. 　　[4]从爽，面向MATLAB工具箱的神经网络理论与应用.3版.合肥：中国科学技术大学出版社，2003：64-158. 　　[5]