- 28
- 0
- 约 25页
- 2018-03-23 发布于重庆
- 举报
支持向量机及Python代码实现
HYPERLINK /marvin521/article/details/9286099 \t _blank 支持向量机及Python代码实现
? ?做机器学习的一定对支持向量机(support vector machine-SVM)颇为熟悉,因为在深度学习出现之前,SVM一直霸占着机器学习老大哥的位子。他的理论很优美,各种变种改进版本也很多,比如latent-SVM, structural-SVM等。这节先来看看SVM的理论吧,在(图一)中A图表示有两类的数据集,图B,C,D都提供了一个线性分类器来对数据进行分类?但是哪个效果好一些?
(图一)
? ? ? ? 可能对这个数据集来说,三个的分类器都一样足够好了吧,但是其实不然,这个只是训练集,现实测试的样本分布可能会比较散一些,各种可能都有,为了应对这种情况,我们要做的就是尽可能的使得线性分类器离两个数据集都尽可能的远,因为这样就会减少现实测试样本越过分类器的风险,提高检测精度。这种使得数据集到分类器之间的间距(margin)最大化的思想就是支持向量机的核心思想,而离分类器距离最近的样本成为支持向量。既然知道了我们的目标就是为了寻找最大边距,怎么寻找支持向量?如何实现?下面以(图二)来说明如何完成这些工作。
(图二)
假设(图二)中的直线表示一个超面,为了方面观看显示成一维直线,特征都是超面维度加一维度的,图中也可以看出,特征是二维,而分类器是一维的。如果特征是三维的,分类器就是一个平面。假设超面的解析式为,那么点A到超面的距离为,下面给出这个距离证明:
(图三)
在(图三)中,青色菱形表示超面,Xn为数据集中一点,W是超面权重,而且W是垂直于超面的。证明垂直很简单,假设X’和X’’都是超面上的一点,
,因此W垂直于超面。知道了W垂直于超面,那么Xn到超面的距离其实就是Xn和超面上任意一点x的连线在W上的投影,如(图四)所示:
(图四)
而(Xn-X)在W上的投影可通过(公式一)来计算,另外(公式一)也一并完成距离计算:
(公式一)
? ? ?注意最后使用了配项法并且用了超面解析式才得出了距离计算。有了距离就可以来推导我们刚开始的想法:使得分类器距所有样本距离最远,即最大化边距,但是最大化边距的前提是我们要找到支持向量,也就是离分类器最近的样本点,此时我们就要完成两个优化任务,找到离分类器最近的点(支持向量),然后最大化边距。如(公式二)所示:
(公式二)
? ? ? ? 大括号里面表示找到距离分类超面最近的支持向量,大括号外面则是使得超面离支持向量的距离最远,要优化这个函数相当困难,目前没有太有效的优化方法。但是我们可以把问题转换一下,如果我们把大括号里面的优化问题固定住,然后来优化外面的就很容易了,可以用现在的优化方法来求解,因此我们做一个假设,假设大括号里的分子等于1,那么我们只剩下优化W咯,整个优化公式就可以写成(公式三)的形式:
(公式三)
? ? ? ? 这下就简单了,有等式约束的优化,约束式子为,这个约束等式背后还有个小窍门,假设我们把样本Xn的标签设为1或者-1,当Xn在超面上面(或者右边)时,带入超面解析式得到大于0的值,乘上标签1仍然为本身,可以表示离超面的距离;当Xn在超面下面(或者左边)时,带入超面解析式得到小于0的值,乘上标签-1也是正值,仍然可以表示距离,因此我们把通常两类的标签0和1转换成-1和1就可以把标签信息完美的融进等式约束中,(公式三)最后一行也体现出来咯。下面继续说优化 求解(公式四)的方法,在最优化中,通常我们需要求解的最优化问题有如下几类:
? ? ? ?(i)无约束优化问题,可以写为:
? ? ? ? ? ? ??min f(x); ?
? ? ? ?(ii)有等式约束的优化问题,可以写为:
? ? ? ? ? ? ?? ? ?min f(x),?
? ? ? ? ? ? ? ? ? ?s.t. h_i(x) = 0; i =1, ..., n?
? ? ? ? (iii)有不等式约束的优化问题,可以写为:
? ? ? ? ? ? ?? ?min f(x),?
? ? ? ? ? ? ? ? ?s.t. g_i(x) = 0; i =1, ..., n
? ? ? ? ? ? ? ? h_j(x) = 0; j =1,..., m
? ? ? ?对于第(i)类的优化问题,常常使用的方法就是Fermat定理,即使用求取f(x)的导数,然后令其为零,可以求得候选最优值,再在这些候选值中验证;如果是凸函数,可以保证是最优解。
? ? ? ?对于第(ii)类的优化问题,常常使用的方法就是拉格朗日乘子法(LagrangeMultiplier),即把等式约束h_i(x)用一个系数与f(x)写为一个式子,称为拉格朗日函数,而系数称为拉格朗日
您可能关注的文档
- 挂车轮胎自燃原因分析预防措施和应急处置.docx
- 挂靠单位承诺书-版本.docx
- 挂靠条件及管理办法.doc
- 挂靠风险分析.docx
- 挂网锚喷技术在边坡加固工程中的应用.doc
- 指纹的观察1.doc
- 挖掘教育科研潜力创新中等职业教育.doc
- 振动单位换算表.doc
- 指挥调度方案.docx
- 据传《生化危机7》或已经开始配音制作.doc
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
最近下载
- 六年级语文下册第一单元【教材解读】.pptx VIP
- 初中英语不规则动词变化.doc VIP
- 2025年江苏财经职业技术学院单招(语文)测试试卷.docx VIP
- 自考00009政治经济学(财经类)密训高频考点重点汇总.docx VIP
- catalix 100 liquid product sheet用于皮革水份调节基于脂肪酸衍生物弱阳离子.pdf VIP
- 《“互联网+护理服务”紧急事件应急处置规范》.pdf VIP
- dermalix wwl paste product sheet基于混合脂肪酸衍生物柔软和分散加脂剂.pdf VIP
- 《化工安全生产概况》课件.ppt VIP
- 2025贺州教育局事业单位考试真题及答案汇总.docx VIP
- 人教版2026-2027学年七年级英语下册教学计划(及进度表).docx
原创力文档

文档评论(0)