- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 14
文献出处:Neves R F P, Zanchettin C, Filho A N G L. An Efficient Way of Combining SVMs for Handwritten Digit Recognition[M]// Artificial Neural Networks and Machine Learning – ICANN 2012. Springer Berlin Heidelberg, 2012:229-237.
翻译后中文字数:4763
第一部分为译文,第二部分为原文。
默认格式:中文五号宋体,英文五号Times New Roma,行间距1.5倍。
一种结合支持向量机的手写数字识别的有效方法
摘要:本文提出了一种将组合SVM(支持向量机)与其他分类器相比较,以保证高识别率和短处理时间的多问题的方法。这种分层的SVM组合考虑了高识别率和短处理时间作为评价标准。使用的案例研究是手写数字识别问题,并取得初步实验成功。
关键词:模式识别,手写数字分类器,支持向量机。
1引言
现在世界是数字化的。技术在人们的生活中无处不在,一些人工任务,如手写识别,语音识别,人脸识别等都可以由机器来替代。在这种应用中使用的主要识别过程[1][2]需要以下步骤:数据采集;预处理数据消除噪声;分割,其中要识别的对象(文本,数字,面部等)位于背景中并分离;特征提取,其中提取每个对象的主要特征;最后有识别或分类,其中的对象是根据其特征进行标记的。本文将重点放在分类任务上,用作案例研究手写数字识别问题,因为这个任务可以代表一些分类问题。例如,模式可能是不明确的,或者一些功能在多个类中是相似的。这个问题的一个例子如图1所示。在图1中1a和图1中1c图像的正确值为7,而在图1中1b是4,但图1a和b是相似的,可以是相同的数字。
因此,构建一个概括好的分类器是一项艰巨任务。在某些情况下,最好的选择是尝试使用上下文信息来区分。隐马尔可夫模型(HMM)[3]是一种经常用于分析上下文并提高分类器识别率的技术。但其主要缺点是处理时间。建模上下文技术通常也较慢。因此,我们的研究重点是研究经典方法的优化和组合,并尝试在分类器中引入更多的知识。
近年来手写数字识别研究的简要概述表明,经典分类器,如多层感知器(MLP)[5],k-最近邻(kNN)[2]和支持向量机(SVM)[6]用过的。一些研究人员尝试使用这些分类器的组合来改进结果[7][8][10][11][12]。组合不同技术的主要问题是我们结合了二者的优势同时也不可避免地结合了二者的缺点。
MLP[5]是用于多类问题的强大分类器,但是当使用反向传播作为学习算法时,存在缺点。该算法可以以局部最小值停止训练。但是,如果我们尝试继续训练阶段,网络可以超越权重,降低泛化能力,就可以使用动量策略来摆脱局部最小化。kNN[2]根据距离样本最近的训练集中的模式的距离对样本进行分类。因此,训练集合中的模式越多,类之间的分布也越均匀,识别率越高。但是,对样本进行分类的时间取决于训练数据库中模式的数量。因此,这种技术通常是缓慢的。
SVM[6]被认为是最好的二进制分类器,因为它找到两个类之间最好的分隔边距。SVM是一个二进制分类器的事实是其最大的缺点,因为大多数的识别任务是多类问题。为了解决这个问题,有些研究人员尝试将SVM[8]组合起来,或者将其用作决策者分类器[9]。
基于这些假设,本文介绍了一种分层SVM组合,在应用于手写数字识别时,可以在短时间内提供高精度的识别率。
本研究结构如下:相关文献见第2节;第3节提出的SVM组合架构;实验和结果在第4节;本文的最终结论在第5节。
2相关文献
支持向量机(SVM)[6][5]是一种二进制分类技术。训练阶段包括查找每个类的支持向量,并创建一个函数,表示不同类的支持向量之间的最佳分离边距。因此,可以获得一个最优的类分离的超平面。分析支持向量机及其先前提出的特征,它似乎类似于感知器[1],因为它也试图找到一个线性函数来分离类。但有两个主要的区别:SVM发现最优线性函数,而感知器寻求发现任何线性分离函数;第二个区别是SVM可以处理非线性的可分离数据。为了做到这一点,SVM利用核函数来增加特征维数,从而使数据线性地分离。
有两种经典的方法可以使用支持向量机来处理多个类:一反对全部和一反对一[13]。在一个反对所有的方法,一个SVM是为每个类创建。如果我们有10类,例如,在数字识别,我们将有10向量,每个数字一个。这样我们训练支持向量机(0)区分0类和其他类标记为1,其他模式为0;SVM(1)以相同的方式将类1与其他类区分开来,等等。在识别阶段,模式被提交到10向量,应答标签1的SVM表示模式的类[2]。训练集是相同的数据库,所有向量只改变模式的标签。如果
您可能关注的文档
- 与经典同行,与圣贤为友国旗下演讲稿.doc
- 员工竞业限制管理办法.pdf
- 员工消防安全培训记录(模板).doc
- 运动会代表队情况简介.doc
- 在商贸公司实习心得.doc
- 宅基地分割合同协议书范本.doc
- 争创六好乡镇工会汇报(精).doc
- 正定型血型检测卡标准操作程序.docx
- 职业及收入证明.doc
- 质量管理体系文件--PPAP生产件批准程序.doc
- 2025AACR十大热门靶点推荐和解读报告52页.docx
- 财务部管理报表.xlsx
- 高中物理新人教版选修3-1课件第二章恒定电流第7节闭合电路欧姆定律.ppt
- 第三单元知识梳理(课件)-三年级语文下册单元复习(部编版).pptx
- 俄罗斯知识点训练课件-七年级地理下学期人教版(2024).pptx
- 课外古诗词诵读龟虽寿-八年级语文上学期课内课件(统编版).pptx
- 高三语文二轮复习课件第七部分实用类文本阅读7.2.1.ppt
- 高考物理人教版一轮复习课件第4章第3讲圆周运动.ppt
- 高考英语一轮复习课件53Lifeinthefuture.ppt
- 2025-2030衣柜行业风险投资发展分析及投资融资策略研究报告.docx
文档评论(0)