- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文章编号:1009-8119(2005)09-0041-03
基于SVM的手写体阿拉伯数字识别张 鸽 陈书开
410076)
摘 要 支持向量机(SVM)是近年来在统计学习理论的基础上发展起来的一种新的模式识别方法,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。介绍了在提取穿越次数特征、粗网格特征以及密度特征提取的基础上应用SVM进行手写体阿拉伯数字识别的方法。
关键词 SVM,核函数,穿越次数特征,粗网格特征,密度特征
Handwriting Numerals Recognition based on SVM
Zhang Ge Chen Shukai
(Department of Computer and Communication,Changsha Univesity of Science and Technology,
Changsha 410076)
Abstract Supprot Vector Machine(SVM) is a new pattern recognition method developed in recent years on the goundation of statistical learning theory.It wins populatity due to many attractive features and emphatical performance in the fields of nonlinear and high dimensional pattern recognition .The paper introduces a script arabic numerals recognition method applied SVM based on drawing out Traversing-times character and Wide-gridding character.
Keywords SVM, Kenerl Function, Traversing-times character,Wide-gridding character, density character
1 引 言
手写体阿拉伯数字识别是图象处理和模式识别领域中的研究课题之一。字符识别系统一般由图象采集、信号预处理、特征提取、分类识别等几个部分组成。识别系统的识别方式可分为联机手写体字符识别、脱机印刷体字符识别和脱机手写体字符识别等,其中脱机手写体字符由于书写者的因素,使其字符图像的随意性很大,例如,笔画的粗细、字体的大小、手写体的倾斜度、字符笔画的局部扭曲变形、字体灰度的差异等都直接影响到字符的正确识别。所以手写体数字字符的识别是数字字符识别领域内最具挑战性的课题。
近年来,支持向量机( Support Vector Machines,SVM)的研究在广泛开展。支持向量机是V.Vipnik 等根据统计学习理论(Statistical Learning Theory简称 SLT)提出的一种新的机器学习方法,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,已经在模式识别、函数逼近和概率密度估计等方面取得了良好的效果[1]。支持向量机从本质上讲是一种前向神经网络,根据结构风险最小化准则,在使训练样本分类误差极小化的前提下,尽量提高分类器的泛化推广能力。从实施的角度,训练支持向量机的核心思想等价于求解一个线性约束的二次规划问题,从而构造一个超平面作为决策平面,使得特征空间中两类模式之间的距离最大,而且它能保证得到的解为全局最优解。本文即是采用SVM进行0~9的手写体阿拉伯数字的识别。
2 SVM基本原理
2.1 线性可分情况
SVM方法是从线性可分情况下的最优分类面(Optimal Hyperplane)提出的。所谓最优分类面就是要求分类线不但能将两类样本无错误的分开,而且要使两类之间的距离最大。
设线性可分样本集为(xi, yi), i=1,2,…,n, x∈Rd, y∈{+1,-1}是类别标号。d维空间中线性判别函数的一般形式为:g(x)=w·x+b,分类面方程为:
w·x+b=0 (1)
将判别函数进行归一化,使两类所有样本都满足 |g(x)|≥1,即,使离分类面最近的样本的|g(x)|=1,这样分类间隔就等于2/‖w‖,因此间隔最大等价于使‖w‖(或‖w‖2)最小;而要求分类线对所有样本正确分类,就是要求其满足:
yi[(w·xi)+b]—1≥0,(i=1,2,…,n) (2)
因此,满足上述条件且使‖w‖
您可能关注的文档
- 基于NiosⅡ 与U 盘安全控制器设计与实现.doc
- 基于OpenGL 与教育机器人软件系统设计与实现.doc
- 基于OPTA 细化算法与有关脑动脉瘤检测研究吴建, 张广明, 谢杰, 崔志明2009 年8 月21 日~ 23 日中国黄山20.doc
- 基于OPTIMUS 与通风机进风口集成优化计算.doc
- 基于PCA 方法与阜新农业环境可持续发展综合评价.doc
- 基于PCA 与森林生物量遥感信息模型研究[J].doc
- 基于PDCA 法与教学质量控制应用与研究.doc
- 基于PIC 单片机与智能充电器与设计与实现.doc
- 基于PID 变频调速技术与纸浆模塑烘干线系统设计.doc
- 基于PLC 和触摸屏与静电水膜除尘系统设计.doc
文档评论(0)