- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
svm的基本原理-read
SVM的SMO算法实现
自研0 谭李(006334) 吴翔(006333)
摘要
支持向量机(Support Vector Machine)是一种新近出现的解决模式识别问题的有效工具。它的数学模型可以归结为一个有约束的二次规划问题。如何快速准确地解这个二次规划,是SVM推广应用中的一个重要环节。我们尝试了数种可能的方法,用程序实现了其中最有效的一种——SMO算法(Sequential Minimal Optimization algorithm),并用块算法的思想(Chunking)对其作出了改进。本文将先给出待解决的数学模型,介绍我们所做的一些尝试,然后着重讨论SMO算法的原理、程序实现及其独特优势,最后阐述我们自己的一些新思想,主要是经过改进的Chunking SMO算法,并在附录中介绍SVM的基本原理。
SVM的数学模型
这里简要介绍支持向量机(SVM)数学模型的引出过程,关于SVM的详细介绍将在附录中给出。
支持向量机的原理是用分类超平面将空间中两类样本点正确分离,并取得最大边缘(正样本与负样本到超平面的最小距离)这样,原问题为一个有约束非线性规划问题:
范数最小的满足约束的w就是最优分类超平面的法向量。目标函数是严格上凹的二次型,约束函数是下凹的,这是一个严格凸规划。按照最优化理论中凸二次规划的解法,我们把它转化为Wolfe对偶问题来求解:
其中αi正是样本点xi的Lagrange乘子。Kuhn-Tunker条件定理指出,无效约束所对应的Lagrange乘子一定为0,在这里的物理意义也就是说非支持向量xi(对应着原问题中的约束 yi(w’xi+b)-10 )的Lagrange乘子一定为0。这样分类规则就仅由恰好在超平面边缘上的少数支持向量(对应着约束yi(w’xi+b)-1=0)决定,而与其它样本无关。“支持向量机”这一名称由此而来。
对于非线形情况,只需将对偶问题中的点积用卷积核函数K(xi,xj)代替。
对于样本点不可分的情况,构造软边缘分类面,最终得到的Wolfe对偶问题与原来相似,只是α多了一个上限约束。这个上限C代表着对错分样本的惩罚力度,在边缘之内的样本对分类面的构造所起的作用是有限制的,这就是所谓“软边缘”的含义。
最后,由于求最大值可以转化为取负求最小值,这一数学模型最终表达为:
其中H是一个半正定的对称阵[yiyjK(xi,xj)]li,j=1(线性的情况也就是(XY)T(XY), X=[x1,x2,…,xl], Y=diag(y1,y2,…,yl), ) α=[α1, α2,…,αl]T
这个对偶问题仍是一个有约束的二次规划,它的Kuhn-Tucker条件(在SVM的文献中多称为Kaush-Kuhn-Tucker条件)也可等价地表示为
其中ui就是分类面(在非线性下不一定是超平面)函数作用在xi上的输出:
这一KKT条件在我们的问题中有其具体的物理意义:第一种情况是说xi是非支持向量,在分类面边缘以外,其Lagrange乘子为0,对分类面的构造没有影响;第二种情况是说xi是正好在分类面上的支持向量,对应着非零的Lagrange乘子;第三种情况是说xi在分类面边缘以内甚至被错分,其Lagrange乘子受到上限的限制而为C。
关于二次规划算法的探索
Wolfe对偶问题比原始问题易于处理,它把问题转化成了在非负象限内对以样本的Lagrange乘子为变量的半正定的二次函数Wolfe进行优化,并服从一个的等式约束。但由于问题规模比较大,再加上目标函数的二次型已不是正定的,而且约束个数较多,又是等式约束和不等式约束的混合问题,在样本点不可分时还要加以上限的约束。这种复杂局面使得很多高效的算法对此束手无策,SVM方法至今未能得到广泛的应用,难以找到快速的算法不能不说是一个重要的原因。
二次规划是一种常见的优化问题,关于二次规划有一套比较成熟的理论。最初我们试图把这个问题作为一个纯数学问题来对待,从寻优理论中找到一种能解决我们的问题的数值方法,但是可以说是以失败告终。不过,我们还是了解到不少二次规划的一般方法,并从中总结了一些经验。
在二次规划中,条件极值问题的通常解法有罚函数法和单纯形法。
罚函数法在以往曾被作为一种标准的SVM算法。其基本思想是将解不满足约束条件的程度作为惩罚项加在目标函数中,将条件极值问题转化为无条件极值问题来处理,求得其解后增大惩罚力度,将上一步的结果作为下次寻优的起始迭代点,再求解无条件极值问题,直到解满足约束为止。其中的无约束极值问题可以用共轭梯度法求解。典型的共轭梯度法针对的是对称正定的二次规划问题,进行n步迭代一定得到最优解。对于半正定的问题,共轭梯度法也会是可行的,但n步迭代不能结束,算法的停止条件应设为梯度范数在允许误差范围内(也就是说目标函数没有很大下降余地了
您可能关注的文档
- mm光轴间距单个光轴输出区域传感器.pdf
- modfit分析细胞周期指引.doc
- mpsmrp加工计划采购计划62计算模型.ppt
- mwp太阳能电站方案.doc
- m大小输液过滤lvp-svp.ppt
- m室内体积roomvolume.ppt
- nc的安装配置.doc
- nexygenplus操作.pdf
- nod/scid小鼠异种急性移植物抗宿主病模型的-中国试验动物学报.doc
- nice中国-耐氏.pdf
- 2025年成都市玩偶生产荧光涂鸦互动玩偶开发可行性研究报告.docx
- 2025年成都市海绵生产用于体育馆室外运动场地透水改造可行性研究报告.docx
- 2025年天津市体操鞋企业团建运动应用报告.docx
- 2025年上海市溶洞极限运动(速降)场地开发可行性研究报告.docx
- 2025年上海市涵洞工程施工技术应用可行性研究报告.docx
- 2025年上海市体育场馆设施扎带安全防护可行性研究报告.docx
- 2025年上海市牦牛育肥产业园区建设可行性研究报告.docx
- 2025年旅拍宠物陪伴拍摄项目可行性研究报告.docx
- 2025年上海市进口食品节庆主题快闪店可行性研究报告.docx
- 2025年上海市洗选厂尾矿综合利用产业化可行性研究报告.docx
最近下载
- 肩关节疾三病ppt课件.ppt VIP
- 企业数字化转型L1-L5数据架构设计方法论及案例【52页PPT】.pptx VIP
- 显微镜操作手册-ch axio imager.pdf VIP
- 2025年内蒙古包头市住房发展建设集团有限公司招聘11人笔试模拟试题及答案解析.docx VIP
- 2024年包头市住房发展建设集团有限公司人员招聘笔试备考题库及答案解析.docx VIP
- 2025年内蒙古包头市住房发展建设集团有限公司招聘11人笔试备考题库及答案解析.docx VIP
- 2025包头市住房发展建设集团有限公司招聘笔试备考试题及答案解析.docx VIP
- ____公司销售部绩效考核表模板范本.pdf VIP
- 肩关节解剖课件.ppt VIP
- 浙江省丽水市2024-2025学年高二下学期期末考试地理试卷.docx VIP
文档评论(0)