- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于置信度分析的脱机手写数字识别算法
摘要:该文主要研究了脱机手写数字识别中的特征选择与提取和分类器的设计问题,选取了网格特征和交叉点特征,采用了最小距离分类器和基于Fisher判别的线性分类器,并使用基于置信度分析的方法进行混合集成,提高了识别正确率。
关键词:手写数字识别;Fisher判别;置信度分析
中图分类号:TP751文献标识码:A文章编号:1009-3044(2011)21-5202-03
Algorithm Based on Confidence Analysis for Off-Line Handwritten Digits Recognition
GAO Jian-qing, CHEN Xing-e
(Department of Electronic Information Science, Fujian Jiangxia College, Fuzhou 350007, China)
Abstract: This article has mainly studied the characteristic choice, the characteristic extraction and the classifier design questions in the off-line hand-written digits recognition, has selected the grid characteristic and the intersection characteristic, has used the minimum distance classifier and based on the Fisher distinction linear classifier, and uses based on the confidence analysis method carries on the mix integration, enhanced the recognition accuracy.
Key words: handwritten digits recognition; fisher distinction; confidence analysis
脱机手写数字识别是整个OCR领域中最为困难的部分,是一个经典的研究问题,在银行票据的认证、税表的自动处理、邮政编码识别等方面有很多重要的应用。数字的类别虽然只有十种,笔划简单,但是一些测试结果表明,数字的正确识别率比印刷体汉字和联机手写体汉字低。手写数字识别的主要难度在于其变体多,而且对数字识别单字识别正确率的要求高。目前对各类字体的数字识别已经有很多算法,但识别效果仍然不够理想,特别是在脱机手写数字识别方面还处在发展阶段。
脱机手写数字识别算法中,特征的选择与提取和分类器的设计是最关键的部分,本文采用了网格特征、交叉点特征的特征提取方法,给出了最小距离分类器和基于Fisher判别的线性分类器的分类方法,并使用基于置信度分析的方法进行混合集成,提高了识别正确率。
1 特征提取
脱机手写数字图像经过灰度化、二值化、锐化、去除噪声点、倾斜调整、数字分割、归一化和细化等预处理后,需要根据识别方法的进行图像特征抽取,选择的特征要求能够足够代表这个图像模式,而且特征的数量尽可能少,这样能有效地进行分类和降低计算量。本文选取了网格特征和交叉点特征,选取这两种特征符合了保持足够的信息量和相关性小的原则,同时特征维数为16个,也不大。
1.1 网格特征
经过归一化后,图像的大小都是16×16,把图像分成4×2=8个格子,在每个格子里面统计黑色像素的个数,这样就形成一个8维的特征。网格的分法划分的方法跟归一化后的大小和字符的形状特征有关系,可以划分为2×2,3×3,4×4等。数字字符一般在纵向的特征信
息比较丰富一些,所以采用4×2比较合适,在纵向分成4块,横向分成2块。按照从上到下,从左到右的顺序,对每个格子中的黑色像素进行统计,存入向量X中,则X=(x1,x2,x3,x4,x5,x6,x7,x8)。在图1中是经过预处理后的手写数字图像“5” 的网格特征划分示意图,对该图进行网格特征统计后,特征向量X=(4,6,4,0,2,7,7,5)。
1.2 交叉点特征
交叉点特征与网格特征对整个图像的划分完的每个区域的黑色像素进行统计不同,是对局部位置的黑色像素的个数进行统计。为了提高特征的分类能力,必须选具有代表性的取局部特征。在纵向的特征信息比较丰富,因此在纵向应该选取更多的局部特征,而边缘部分不适合选取,因为通过细化后的图像边缘部分有很多白色,区分度不高。交叉点特
您可能关注的文档
最近下载
- 北师大版八年级物理上册《走进物理世界》教案及教学反思.docx VIP
- 部编版语文 一年级上期 拼音综合复习 练习题.docx VIP
- 初一新生开学家长会课件.pptx VIP
- 2023年深圳市南山实验学校麒麟中学部小升初分班考试英语模拟试卷及答案解析.docx VIP
- 《纳米材料与器件》全套教学课件.pptx VIP
- 2025年评标专家培训考试题及答案.docx VIP
- 食品供货方案.docx VIP
- 2021烟草物流师三级考试-烟草物流师三级考试(精选试题).doc VIP
- 采购员面试英文自我介绍.doc VIP
- DLT774-2015 火力发电厂热工自动化系统检修运行维护规程.docx VIP
文档评论(0)