- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
脱机手写数字识别技术研究.doc
脱机手写数字识别技术研究
摘要:针对目前常见的脱机手写数字识别技术进行分析比较,并模拟人工智能识别字符的过程,提出一种分层识别方法。对于结构差异较大的数字字符,根据数字字符图像的统计特征进行粗略识别;然后进一步利用结构特征细致区分形状相近的数字字符。通过自制样本库进行识别测试,结果表明该方法能够有效提高识别准确率。
中国 8/vie
关键词:脱机手写数字识别;统计特征;结构特征
中图分类号:TP391.41 文献标识码:A :1009-3044(2016)29-0195-03
脱机手写数字识别,就是利用数字化设备将纸质或其他介质上手写的数字字符扫描为数字图像信息,然后利用计算机进行一系列的数字图像处理步骤进行数字识别处理的技术。相对于目前比较成熟的联机手写字符识别,由于缺少联机能够获取的字符笔顺等重要信息,其技术实现难度要大。另外,脱机手写数字识别在邮政、银行、交易等领域应用需求广泛,所以是近年来图像处理领域研究的热点。
本文在分析目前常见的脱机手写数字识别技术的基础上,提出一种分层次的识别方法。该方法模拟人类识别字符的一般规律,首先抽取数字字符样本的统计特征,通过对主分量重建模型的误差分析进行字符的粗略识别;然后加入宽高比结构特征进行字符比对,进行第二层次的细致识别。
1常见的脱机手写数字识别技术
脱机手写数字识别最重要的环节是字符的特征提取,根据采用的特征提取方法的不同,可以将目前常见的脱机手写数字识别大致分为两类:基于统计特征和基于结构特征的方法。
基于统计特征的识别方法主要有两个过程:分类器学习训练过程和利用分类器识别过程。学习训练是将获取的样本信息经过预处理和特征提取之后给分类器学习,以此为识别的基础,让分类器获得识别的能力。识别过程将待识别的信息经过同样的预处理与特征提取后让分类器分类识别。统计方法的优点是能较好地描述一类模式的本质特征,对干扰信息不敏感,对与训练样本一致的信息识别正确率很高,缺点是对一些不稳定的字符形态容易误判。所以该方法类似于人类识别字符的粗略宏观过程。
基于结构特征的方法是分析字符笔画的构造如圈、端点、交叉点、轮廓等识别特征,结合字符间互斥的特征进行识别。方法能够精确地描述字符的细节特征,比较直观,对字符图像畸变的抗干扰能力较强,可靠性较高;缺点对噪声、断线等干扰较敏感,另外字符骨架提取等过程实现复杂度高。该类方法类似于人类识别字符的细致区分过程。
由于不同人的书写习惯和书写风格不同,使手写数字字符的形态极不稳定。根据人工智能识别字符的规律,可以将两类方法结合起来,分层进行识别,从而克服各自的不足,提高字符识别的准确度。
2脱机手写数字的分层识别方法
脱机手写数字识别,首要任务就是利用扫描设备将纸质载体扫描为图像信息以便计算机处理。得到的数字图像在?M行识别之前需要进行图像的预处理,以消除图像中无关的信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。预处理过程一般有几何变换、平滑、复原和增强、提取边缘、细化等步骤。这些图像预处理技术比较成熟,可以直接应用。
2.1主分量分析法提取统计特征及识别
3.1主分量分析法识别数字实验
步骤一:学习阶段
利用主分量分析法对0到9十个数字的训练样本提取统计特征,得到0到9十个模式类的前d个主分量重建得到的数字模型。以数字“6”为例,给出前d个主分量的重建模型图如图l所示,主分量个数d分别取3、5、7、10。从图中可以看出d越大,模型图像中包含的信息越多。
图1样本“6”前d个主分量的重建模型图
步骤二:识别阶段
将测试样本分别在各模式的特征空间估计对应于各模式的重建模型,再与各模式的重建模型相减得到重建误差,比较误差大小,误差越小,与对应的数字模式类越相似。
任意给出测试样本中经过预处理的0-9十个数字的图像如图2所示。
0-9十个手写数字字符(下表中用“”中的数字代表),在数字6的特征空间,分别构建的重建模型图像如图3所示:
根据公式(2),对任意选取的这十个数(测试样本)的重建模型与训练样本的重建模型相减求模,得到模型误差值进行识别。
这里,我们只针对“6”的样本集进行分析。当d=10的时候,任意十个数的测试样本与“6”样本集的重建模型相减,得到如图4中所示的十个误差图像。
对图4中图像求模得到误差值,误差值越小,说明测试样本数字的形态与数字“6”越相似。发现测试样本数字“6”的重建模型误差值最低,说明本方法是合理的。
其次误差值最小的是“4”,然后是“5”,其余的数字的误差较大。究其原因,我们分析表2中测试样本的图像不难发现,书写的数字4和5有与数字6最相近
原创力文档


文档评论(0)