基于非线性状态估计(NSET)手写体数字识别系统设计.docVIP

下载本文档

16
0
约3.84千字
约 7页
2017-11-22 发布于福建
举报
版权申诉

基于非线性状态估计(NSET)手写体数字识别系统设计.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于非线性状态估计(NSET)手写体数字识别系统设计

基于非线性状态估计(NSET)手写体数字识别系统设计　　[摘要]手写体数字识别技术在财会、气象、邮政等领域有着广泛的应用，探究数字识别新方法并付诸实践，可以产生巨大的社会和经济效益。本文从传统的非线性状态估计（Nonlinear State Estimate Technology，NSET）技术出发，将这种一般应用于设备运行状态监测领域的方法应用于手写体数字识别，并在美国邮政服务（United States Postal Service，USPS）手写数字识别库上进行测试。测试结果表明，该方法简单易行，运算效率高，对于解决非线性和高维模式识别问题凸显出其适应性强的特点。 [关键词]数字识别非线性状态估计 USPS 非线性运算子中图分类号：TP391 文献标识码：TP 文章编号：1009?914X（2013）34?0073?03 0 引言本文将传统的应用于系统或设备状态监测领域的非线性状态估计技术（NSET）用于手写体数字识别，能够有效减小计算量，提高运算效率，并且在美国邮政服务（USPS）手写数字识别库上做了测试工作，最后给出测试结果及分析，表明NSET方法能够拓展应用于手写体数字识别系统，具有较高的正确识别率。 1 非线性状态估计技术 1.1非线性状态估计理论非线性状态估计（NSET）是由Singer等提出的一种非参数、非线性建模方法，通常应用于电子产品寿命预测[1]、设备状态监测[2]、核电站传感器校验[3]、风机齿轮箱温度预测[4]等领域，而用于模式识别领域，目前阶段还鲜有报道。 USPStrainingdata.mat为训练用数据，采用结构体形式组织数据，其中成员变量traindata为特征向量，维数为256，成员变量traintarg为其所对应的数字，一共10列，10列中值为1的那一列代表数字，比如第一行中，第七个值为1，则代表这个数为7，特别指出的是，第十列表示0。USPStestingdata.mat为测试用数据，数据组织形式与USPStrainingdata.mat相同，无须赘述。图1为部分USPS样本。从图中可以看出，该字库中的字符笔画的形态、粗细和灰度等级的差别都很显著。 2 功能实现过程手写体数字识别的一般流程主要经过了手写数字预处理（增强、二值化、细化、归一化）、特征提取（选择）和分类三个步骤。本文采用NSET方法，训练和测试工作主要在USPS手写体数字识别库上实现，而这个数据库已经完成了原始图像的预处理工作，即已经将灰度值归一化，并且按照一定规则组织数据，这样就可以集中精力进行识别算法的研究。原始数据的特征维数为256，这样一个高维数或更高维数的特征向量，如若采用传统的人工神经网络，易陷入维数灾难，而NSET方法只是简单的矩阵运算，可以有效减少运算量，提高运行速度。采用NSET方法的实现原理图如图2所示。程序功能实现上，可以分为数据录入模块、构建过程记忆矩阵模块、测试模块、测试结果输出模块等。在系统实际应用过程中，由于所针对的均为高维特征向量，难免影响运行效率和速度，所以将手写体数字识别系统人为划分为离线（Offline）和在线（Online）两部分。如图3中所示，离线部分主要是完成前期准备工作，这些工作不会影响实际运行的效率，在完成特征选取、前期预处理、构建过程记忆矩阵以及中间变量前期处理后，可以将其作为不变量存储，应用时直接从指定位置取出即可；而在线运行部分对识别系统的运行效率有着重要影响，这部分的实现算法需要精心设计，确保运行过程中不会出现“卡壳”现象或者导致系统本身运行速度变慢。 3 仿真测试结果及分析前面已经述及，非线性运算符是NSET实现的一个关键技术，它不仅解决了可逆计算的问题，而且从不同的侧面刻画了观测特征向量和预测特征向量之间的相近或相似程度，对于探究特征向量之间的内在联系，把握重点信息具有重要意义。本文采用欧氏距离（DIST）和曼哈顿距离（CITY）进行了应用研究。源数据采用美国邮政服务手写数字识别库，若采用欧氏距离，测试总成功率为94.82%，单类手写体数字识别率统计如表1中第二列所示；若换做曼哈顿距离测试，其测试的总成功率为95.24%，单类手写体数字识别率统计如表1中第三列所示。并且针对每类字符，都进行了相应的平均识别率统计，结果附在表1第四列。从表1中可以看出，不同类别字符间识别精度存在差异，最典型的为字符4，采用欧氏距离其识别精度只有89.76%，明显低于其它类别字符识别精度，这与其笔画复杂程度有直接关系，使二值灰度信息不足以精确描述该字符，致使识别精度下降，但总体的测试成功率还是可以接受的。通过对两种不同的距离函数进行测试，比较其