支持向量機（ support vector machine,SVM）.pptVIP

下载本文档

2
0
约3.74千字
约 38页
2017-04-10 发布于上海
举报
版权申诉

支持向量機（ support vector machine,SVM）.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

支持向量機（ support vector machine,SVM）

支持向量机（ support vector machine，SVM） Wang Jimin Nov 18, 2005 Outline SVM的理论基础线性判别函数和判别面最优分类面支持向量机 SVM的研究与应用 SVM的理论基础传统的统计模式识别方法只有在样本趋向无穷大时，其性能才有理论的保证。统计学习理论（STL）研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。传统的统计模式识别方法在进行机器学习时，强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”，其推广能力较差。推广能力是指: 将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。过学习问题 “过学习问题”：某些情况下，当训练误差过小反而会导致推广能力的下降。例如：对一组训练样本(x,y),x分布在实数范围内，y取值在[0，1]之间。无论这些样本是由什么模型产生的，我们总可以用y=sin(w*x)去拟合，使得训练误差为0. SVM 根据统计学习理论，学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差，没有最小化置信范围值，因此其推广能力较差。 Vapnik 提出的支持向量机（Support Vector Machine, SVM）以训练误差作为优化问题的约束条件，以置信范围值最小化作为优化目标，即SVM是一种基于结构风险最小化准则的学习方法，其推广能力明显优于一些传统的学习方法。形成时期在1992—1995年。 SVM 由于SVM 的求解最后转化成二次规划问题的求解，因此SVM 的解是全局唯一的最优解 SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势，并能够推广应用到函数拟合等其他机器学习问题中 Joachims 最近采用SVM在Reuters-21578来进行文本分类，并声称它比当前发表的其他方法都好 Outline SVM的理论基础线性判别函数和判别面最优分类面支持向量机 SVM的研究与应用线性判别函数和判别面一个线性判别函数(discriminant function)是指由x的各个分量的线性组合而成的函数两类情况:对于两类问题的决策规则为如果g(x)0，则判定x属于C1，如果g(x)0，则判定x属于C2，如果g(x)=0，则可以将x任意分到某一类或者拒绝判定。线性判别函数下图表示一个简单的线性分类器，具有d个输入的单元，每个对应一个输入向量在各维上的分量值。该图类似于一个神经元。超平面方程g(x)=0定义了一个判定面，它把归类于C1的点与归类于C2的点分开来。当g(x)是线性函数时，这个平面被称为“超平面”(hyperplane)。当x1和x2都在判定面上时，这表明w和超平面上任意向量正交，并称w为超平面的法向量。注意到：x1-x2表示超平面上的一个向量判别函数g(x)是特征空间中某点x到超平面的距离的一种代数度量 ?从下图容易看出上式也可以表示为： r= g(x)/||w||。当x=0时，表示原点到超平面的距离，r0= g(0)/||w||=w0/||w||，标示在上图中。总之：线性判别函数利用一个超平面把特征空间分隔成两个区域。超平面的方向由法向量w确定，它的位置由阈值w0确定。判别函数g(x)正比于x点到超平面的代数距离（带正负号）。当x点在超平面的正侧时，g(x)0；当x点在超平面的负侧时，g(x)0 多类的情况利用线性判别函数设计多类分类器有多种方法。例如可以把k类问题转化为k个两类问题，其中第i 个问题是用线性判别函数把属于Ci类与不属于Ci类的点分开。更复杂一点的方法是用k(k-1)/2个线性判别函数，把样本分为k个类别，每个线性判别函数只对其中的两个类别分类。广义线性判别函数在一维空间中，没有任何一个线性函数能解决下述划分问题（黑红各代表一类数据），可见线性判别函数有一定的局限性。广义线性判别函数如果建立一个二次判别函数g(x)=(x-a)(x-b)，则可以很好的解决上述分类问题。决策规则仍是：如果g(x)0，则判定x属于C1，如果g(x)0，则判定x属于C2，如果g(x)=0，则可以将x任意分到某一类或者拒绝判定。广义线性判别函数广义线性判别函数设计线性分类器 Fisher线性判别方法如：Fisher线性判别方法，主要解决把d维空间的样本投影到一条直线上，形成一维空间，即把维数压缩到一维。然而在d维空间分得很好的样本投影到一维空间后，可能混到一起而无法分割。但一般情况下总可以找到某个方向，使得在该方向的直线上，样本的投影能分开的最好。目的是降维,在低维空间中分割 O