支持向量机入门.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
支持向量机入门 第一页,共三十二页,2022年,8月28日 内容 SVM的理论基础 线性判别函数和判别面 最优分类面 支持向量机 LIBSVM简介 实验 第二页,共三十二页,2022年,8月28日 SVM的理论基础 传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。 传统的统计模式识别方法在进行机器学习时,强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。 推广能力是指: 将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。 第三页,共三十二页,2022年,8月28日 SVM的理论基础 “过学习问题”:某些情况下,当训练误差过小反而会导致推广能力的下降。 例如:对一组训练样本(x,y),x分布在实数范围内,y取值在[0,1]之间。无论这些样本是由什么模型产生的,我们总可以用y=sin(w*x)去拟合,使得训练误差为0. 第四页,共三十二页,2022年,8月28日 SVM的理论基础 根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化置信范围值,因此其推广能力较差。 Vapnik 与1995年提出的支持向量机(Support Vector Machine, SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。 第五页,共三十二页,2022年,8月28日 SVM的理论基础 由于SVM 的求解最后转化成二次规划问题的求解,因此SVM 的解是全局唯一的最优解 SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中. 第六页,共三十二页,2022年,8月28日 线性判别函数和判别面 一个线性判别函数(discriminant function)是指由x的各个分量的线性组合而成的函数 两类情况:对于两类问题的决策规则为 如果g(x)=0,则判定x属于C1, 如果g(x)0,则判定x属于C2 第七页,共三十二页,2022年,8月28日 线性判别函数和判别面 方程g(x)=0定义了一个判定面,它把归类于C1的点与归类于C2的点分开来。 当g(x)是线性函数时,这个平面被称为“超平面”(hyperplane)。 当x1和x2都在判定面上时, 这表明w和超平面上任意向量正交, 并称w为超平面的法向量。 超平面 第八页,共三十二页,2022年,8月28日 线性判别函数和判别面 判别函数g(x)是特征空间中某点x到超平面的距离的一种代数度量. 第九页,共三十二页,2022年,8月28日 线性判别函数和判别面 广义线性判别函数 在一维空间中,没有任何一个线性函数能解决下述划分问题(黑红各代表一类数据),可见线性判别函数有一定的局限性。 第十页,共三十二页,2022年,8月28日 线性判别函数和判别面 广义线性判别函数 如果建立一个二次判别函数g(x)=(x-a)(x-b),则可以很好的解决上述分类问题。 决策规则仍是:如果g(x)=0,则判定x属于C1,如果g(x)0,则判定x属于C2。 第十一页,共三十二页,2022年,8月28日 线性判别函数和判别面 第十二页,共三十二页,2022年,8月28日 线性判别函数和判别面 广义线性判别函数 第十三页,共三十二页,2022年,8月28日 最优分类面 SVM 是从线性可分情况下的最优分类面发展而来的, 基本思想可用下图的两维情况说明. 图中, 方形点和圆形点代表两类样本, H 为分类线,H1, H2分别为过各类中离分类线最近的样本且平行于分类线的直线, 它们之间的距离叫做分类间隔(margin)。 ? 所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大. 推广到高维空间,最优分类线就变为最优分类面。 第十四页,共三十二页,2022年,8月28日 最优分类面 设线性可分的样本集: D维空间中的线性判别函数: 这样分类间隔就等于 ,因此要求分类间隔最大,就要求 最大.而要求分类面对所有样本正确分类,就是要求满足     第十五页,共三十二页,2022年,8月28日 最优分类面 求最优分类面(最大间隔法) 已知: 求解: 目标:最优分类面          这是一个二次凸规划问题,由于目标函数和约束条件都是凸

您可能关注的文档

文档评论(0)

xiaolan118 + 关注
实名认证
内容提供者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档