- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
营销研究支持向量机
支持向量机(SVM)简明学习教程
一、最优分类超平面
给定训练数据,其中,。
若,称为第一类的,;若,称为第二类的,。
若存在向量和常数,使得 (1),则该训练集可被超平面分开。
(一)、平分最近点法
求两个凸包集中的最近点,做的垂直平分面x,即为所求。
,则,。
求,
所以,只需求出最小的。
算法:1)求解;2)求最优超平面。
(二)、最大间隔法
附加条件,加上(1)式。记,。
使 (2)
可以说明在(2)下可以得到一个最优超平面,且该超平面是唯一的。
如何快速生成一个最优超平面???
考虑等价问题:求权向量和,使,且最小。
这种写法已经包含最大间隔。
事实上,而,故,。
所以(2)式可以转化为求解:
(3)
总结,求最优超平面,只需求解:
(QP1)
对(QP1)构造lagrange函数:
令,其中为lagrange乘子。
下求的鞍点:
1)、; 2)、。
将2)代入中,且目标改为。
则
所以,(QP1)的对偶问题为: (DQP1)
由KKT条件,。若存在时,有,此时,,则
几何意义:,是与超平面距离最近的向量,称其为支持向量。他在构造超平面中起到及其重要的作用。
SVM算法1(线性可分SVM分类机)
1)、求解规划问题(DQP1)
2)、求和,得到分类超平面。
3)、分类器:。
(三)、软间隔分类超平面
针对样本数据线性不可分的情况。此时。
解决方案:软化约束(通过添加松弛因子)。,其中,。
显然,当充分大时,软约束总是成立的,但不应该取太大。所以将加入到目标中,得到(QP2):
(QP2)
其中,为正的惩罚参数。
显然,QP2包含了QP1的,(取)。另外,QP2的鲁棒性好(稳定性好)
同样,对(QP2)构造lagrange函数:
令。
1)、; 2)、;
3)、。
代入中,得。
所以,(QP2)的对偶问题为: (DQP2)
对于,由KKT条件。当时,,则。
(四)、支持向量机
对于本质线性不可分问题,有两种方法:(1)构造非线性分类器;(2)将样本点射到高维特征空间,再用线性分类器。
例1:不可分
映射:,则可分。
基本思想:,
例2:对于圆,故。但复杂性增大,如,则二次特征空间。
(问题:推广性如何评价,技术上如何处理高维数据???)
1)、核函数
设,,。(注可为无穷)
考虑在Hilbert空间中内积的一个一般表达式:。
根据Hilbert-Schmidt理论,可以是满足下面一般条件的任意对称函数(Courant and Hilbert,1953)
定理(Mercer)要保证中的对称连续函数能以正的系数展开成正定。()
2)支持向量机
训练样本,,则。
求上的超平面将分开(若可分),则最大间隔超平面:
(QP3)
其对偶问题为:
(DQP3)
设(DQP3)有解,则,,()。
从而,决策函数为 。
算法(可分的SVM)
(1)、选样本; (2)、选核函数,用Mercer定理判断; (3)、计算,由(DQP3); (4)、代入决策函数应用。(错误率高可转(2)重来)
同样,对特征映射后的样本点线性可分难于判断,可引人松弛变量:
(QP4)
其对偶问题为: (DQP4)
则,()。
决策函数为。
(存在问题:1、的选择;2、的选择????)
3)常用的核函数
阶多项式核:;
Gauss核:;
,其中为Sigmoid函数,但他不满足Mercer定理。
二、估计实值函数的支持向量机
(一)、回归分析
已知,,最小二乘:,。其定义损失函数为:,使得经验风险最小:。
但是如果,则取,则对的逼近更好。
1964年,Huber提出一个理论:若噪声的密度是一个对称函数,取;若噪声是由某种固定噪声(如正态噪声)与另一有对称连续密度函数的任意噪声的混合,则取。
为了对实值函数构造支持向量机,我们定义不敏感函数:。则:(1)、线性不敏感函数:;(2)、二次不敏感函数:。
(二)、函数估计的SVM
考虑线性回归,。
1)、硬带SVM(即全部样本点都落入带内)
(QP5)
令。
则,代入中即得(DQP5)。
(DQP5)
由KKT条件,若,得;若,得
将,可作非线性回归。
1)、软带SVM(并非所有的样本点都落入带内)
取,将(QP5)变形引入松弛变量。
(QP6)
令
则,代入中即得(DQP6)。
(DQP6)
由KKT条件,若,得;若,得
将,可作非线性回归。
[说明:在求时必须要求,因为若,则一定在带内或界上;若(或者反过来),则一定在界上;若(或者反过来),则一定在界上或界外(证明略)]
在这里,有三个参数控制着SVR的性能,包括平衡参数、管道宽度和核参数,它们都需
您可能关注的文档
- 摩托车拉不动的十种快速排故方法.doc
- 摩托车长途旅行个人装备问题.doc
- 摩羯女性格深入分析.doc
- 撕碎机的分类.ppt
- 撤除四采专用回风巷胶带运输机安全技术措施.doc
- 播音发声基础训练.doc
- 播种友情 课件.ppt
- 播音主持少年宫课件.ppt
- 操作分析.ppt
- 操作系统应用技巧全面奉送.doc
- 2023学年诸暨中学高三年级第二学期3月第二次模拟考试(政治)公开课教案教学设计课件资料.docx
- 运动的合成与分解(二)公开课教案教学设计课件资料.pptx
- 近五年浙江省各地图形的翻折(轴对称)原题公开课教案教学设计课件资料.doc
- 如何做教师-2019-11-13-中关村一小相关公开课教案教学设计课件资料.pptx
- 生活中的圆周运动 (水平面)正式版公开课教案教学设计课件资料.pptx
- 专题10 条件概率与全概率公式公开课教案教学设计课件资料.docx
- 金华市东阳市2019学年第二学期期末测试卷公开课教案教学设计课件资料.doc
- 5 琥珀(第二课时)【慕课堂版】公开课教案教学设计课件资料.pptx
- 项目五 打印米老鼠模型公开课教案教学设计课件资料.ppt
- (打印版)9月25日地理周练公开课教案教学设计课件资料.docx
文档评论(0)