管理课件支持向量机.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
营销研究支持向量机

支持向量机(SVM)简明学习教程 一、最优分类超平面 给定训练数据,其中,。 若,称为第一类的,;若,称为第二类的,。 若存在向量和常数,使得 (1),则该训练集可被超平面分开。 (一)、平分最近点法 求两个凸包集中的最近点,做的垂直平分面x,即为所求。 ,则,。 求, 所以,只需求出最小的。 算法:1)求解;2)求最优超平面。 (二)、最大间隔法 附加条件,加上(1)式。记,。 使 (2) 可以说明在(2)下可以得到一个最优超平面,且该超平面是唯一的。 如何快速生成一个最优超平面??? 考虑等价问题:求权向量和,使,且最小。 这种写法已经包含最大间隔。 事实上,而,故,。 所以(2)式可以转化为求解: (3) 总结,求最优超平面,只需求解: (QP1) 对(QP1)构造lagrange函数: 令,其中为lagrange乘子。 下求的鞍点: 1)、; 2)、。 将2)代入中,且目标改为。 则 所以,(QP1)的对偶问题为: (DQP1) 由KKT条件,。若存在时,有,此时,,则 几何意义:,是与超平面距离最近的向量,称其为支持向量。他在构造超平面中起到及其重要的作用。 SVM算法1(线性可分SVM分类机) 1)、求解规划问题(DQP1) 2)、求和,得到分类超平面。 3)、分类器:。 (三)、软间隔分类超平面 针对样本数据线性不可分的情况。此时。 解决方案:软化约束(通过添加松弛因子)。,其中,。 显然,当充分大时,软约束总是成立的,但不应该取太大。所以将加入到目标中,得到(QP2): (QP2) 其中,为正的惩罚参数。 显然,QP2包含了QP1的,(取)。另外,QP2的鲁棒性好(稳定性好) 同样,对(QP2)构造lagrange函数: 令。 1)、; 2)、; 3)、。 代入中,得。 所以,(QP2)的对偶问题为: (DQP2) 对于,由KKT条件。当时,,则。 (四)、支持向量机 对于本质线性不可分问题,有两种方法:(1)构造非线性分类器;(2)将样本点射到高维特征空间,再用线性分类器。 例1:不可分 映射:,则可分。 基本思想:, 例2:对于圆,故。但复杂性增大,如,则二次特征空间。 (问题:推广性如何评价,技术上如何处理高维数据???) 1)、核函数 设,,。(注可为无穷) 考虑在Hilbert空间中内积的一个一般表达式:。 根据Hilbert-Schmidt理论,可以是满足下面一般条件的任意对称函数(Courant and Hilbert,1953) 定理(Mercer)要保证中的对称连续函数能以正的系数展开成正定。() 2)支持向量机 训练样本,,则。 求上的超平面将分开(若可分),则最大间隔超平面: (QP3) 其对偶问题为: (DQP3) 设(DQP3)有解,则,,()。 从而,决策函数为 。 算法(可分的SVM) (1)、选样本; (2)、选核函数,用Mercer定理判断; (3)、计算,由(DQP3); (4)、代入决策函数应用。(错误率高可转(2)重来) 同样,对特征映射后的样本点线性可分难于判断,可引人松弛变量: (QP4) 其对偶问题为: (DQP4) 则,()。 决策函数为。 (存在问题:1、的选择;2、的选择????) 3)常用的核函数 阶多项式核:; Gauss核:; ,其中为Sigmoid函数,但他不满足Mercer定理。 二、估计实值函数的支持向量机 (一)、回归分析 已知,,最小二乘:,。其定义损失函数为:,使得经验风险最小:。 但是如果,则取,则对的逼近更好。 1964年,Huber提出一个理论:若噪声的密度是一个对称函数,取;若噪声是由某种固定噪声(如正态噪声)与另一有对称连续密度函数的任意噪声的混合,则取。 为了对实值函数构造支持向量机,我们定义不敏感函数:。则:(1)、线性不敏感函数:;(2)、二次不敏感函数:。 (二)、函数估计的SVM 考虑线性回归,。 1)、硬带SVM(即全部样本点都落入带内) (QP5) 令。 则,代入中即得(DQP5)。 (DQP5) 由KKT条件,若,得;若,得 将,可作非线性回归。 1)、软带SVM(并非所有的样本点都落入带内) 取,将(QP5)变形引入松弛变量。 (QP6) 令 则,代入中即得(DQP6)。 (DQP6) 由KKT条件,若,得;若,得 将,可作非线性回归。 [说明:在求时必须要求,因为若,则一定在带内或界上;若(或者反过来),则一定在界上;若(或者反过来),则一定在界上或界外(证明略)] 在这里,有三个参数控制着SVR的性能,包括平衡参数、管道宽度和核参数,它们都需

文档评论(0)

allap + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档