第6章 支持向量机.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第6章支持向量机;简介;本章要点;6.1最大间隔及超平面;6.1最大间隔及超平面;6.2线性可分支持向量机;将距离超平面最近的点与超平面之间的距离记为

最优化问题可写做

;?;?; 在感知机模型中,优化的目标是:在满足模型能够正确分类的约束条件下,使得样本集合中的所有点到分割超平面的距离最小,这样的超平面可能存在无数个。一个简单的例子,假如二维空间中样本集合中正负样本个数点均为一个,那么垂直于两者所连直线,且位于两者之间的所有直线都将是符合条件的解。由于优化目标不同,造成解的个数不同,这是支持向量机与感知机模型很大的一个不同。

;

对于以上提到的优化问题(上式),可使用拉格朗日乘子法进行求解,拉格朗日函数为:

其中,,表示拉格朗日乘子。令对和的偏导为0

;解得:

代入得到:

求对的极大,等价于求对的极小,因此原式的对偶问题为

; 求解上式(对偶问题)的优化问题,即可得到:,根据KKT(Karush-Kuhn-Tucker)条件,是原始问题的最优解,且是对偶问题的最优解的充要条件是:,满足KKT条件,即:

由考察KKT条件的第三条,可以发现或

因此假设,则必有,于是,由此得到分割超平面;?;?;?;?;类似于线性可分支持向量机中的求解过程,上式的拉格朗日函数可写作

是拉格朗日乘子.令对的导数为0,可解得

;代入:

求对的极大,等价于求对的极小.因此,此问题的对偶问题为;?;?;类似线性可分支持向量机,可得

由此得到分割超平面

通过分析的值,可以确定样本相对分割超平面的位置;?;?;对于变量x,合页损失函数的定义为:

对于线性支持向量机,以下左侧的最优化问题,等价于以下右侧优化式中的问题

其中是合页损失的形式

;; 上面讨论的线性可分支持向量机和线性支持向量机都假设数据是线性可分的(线性支持向量机可以认为是为了解决线性可分样本集合???的噪声问题)。而实际场景中我们经常会遇到数据线性不可分的情况。此时,就可以通过本节介绍的核方法将输入空间线性不可分的数据转化为特征空间线性可分的数据,在特征空间求解支持向量机的超平面。

;?;?;?;相应的决策函数为:

;?;?;?;?;?;6.7 实例:基于支持向量机实现葡萄酒分类;项目中选用的模型是sklearn提供的SVC,其构造函数的kernel参数可以选择

linear:线性核函数

poly:多项式核函数

rbf:径向基核函数/高斯核

sigmod:sigmod核函数

precomputed:提前计算好核函数矩阵

这里使用的是最简单的线性核函数。经过测试,模型在训练集的准确率达到0.993,在测试集的准确率达到0.972。如果使用默认的高斯核函数,模型在训练集的准确率可以达到1,但是在测试集的准确率却跌至0.444。这说明,高斯核函数提高了模型容量,但是数据集大小不足,以致模型过拟合。; sklearn还提供了LinearSVC类,该模型默认使用线性核函数。

尝试使用LinearSVC类实现葡萄酒数据集的分类,并体会其与SVC类的区别。

文档评论(0)

长情又很酷 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档