- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 3 章 支持向量机基础
By Dean
支持向量机(Support Vector Machies)是由 Vapnik 等人于 1995 年提出来 的。之后随着统计理论的发展,支持向量机也逐渐受到了各领域研究者的关注, 在很短的时间就得到很广泛的应用。支持向量机是建立在统计学习理论的 VC 维理论和结构风险最小化原理基础上的,利用有限的样本所提供的信息对模型 的复杂性和学习能力两者进行了寻求最佳的折衷,以获得最好的泛化能力。 SVM 的基本思想是把训练数据非线性的映射到一个更高维的特征空间(Hilbert 空间)中,在这个高维的特征空间中寻找到一个超平面使得正例和反例两者间 的隔离边缘被最大化。SVM 的出现有效的解决了传统的神经网络结果选择问题、 局部极小值、过拟合等问题。并且在小样本、非线性、数据高维等机器学习问 题中表现出很多令人注目的性质,被广泛地应用在模式识别,数据挖掘等领域 (张学工 2000;崔伟东 2001)。支持向量机可以用于分类和回归问题,本章着 重介绍分类相关的知识。
3.1 SVM 的基本思想
3.1.1 最优分类面
SVM 是由线性可分情况的最优分类面发展而来的,用于两类问题的分类。 下面用一个二维两类问题来说明 SVM 基本思想(白鹏 等,2008)。
????????, i=1,…N??1212, i=1,…N??12[(?? ??????
??
??
??
??
, i=1,…N
??
1
2
1
2
, i=1,…N
??
1
2
[
(
?? ??
??
?? ≥ 0
?? ?? ??
?? ??
[
]
(
)
?? ??
??
图 3.1 最优超平面示意图
C1 和 C2 代表两类数据样本,各样本在二维中显示如图 3.1,
图中的直线
P0,P1 就是分类函数。如果一个线性函数就完全可以把两类所有样本分开,那 么就称这些数据是线性可分的;否则称非线性可分。假设两类线性可分的训练
数据样本
{(
??
1,??1)
,
(
??
2,??2)
,…(
??
??
,??
)}
,
??
??
∈ ??
(d 代表样本 ??的长度),
??
∈ { + 1, ? 1}
,
?? = 1,2,…,?? . 其线性判别函数的一般表达式是??(??) = ?? ? ?? + ??,
该函数对应的分类面方程是:
?? ? ?? + ?? = 0
(3-1)
线性判别函数的值一般是连续的实数,而分类问题需要输出的是离散值。例如 利用数值-1 表示类别 C1,而用数值+1 表示类别 C2.所有的样本都只能用数值- 1 和+1 表示。这时我们可以通过设置一个阀值,通过判断判别函数的值是大于 或者小于这个阀值来判断属于某一类。若我们取这个阀值为 0,即当 f(x)≤0 时, 判别样本为类别 C1(即-1);当 f(x)≥0 时,判别样本为类别 C2(即+1). 现在将判别函数进行归一化,使两类所有样本都满足|??(??)| ≥ 1,这时离分类面 近的样本都有|??(??)| = 1。若要对所有样本正确分类需满足,
?? [(?? ? ??) + ??] ? 1 ≥ 0
(3-2)
这时分类间隔为2 ‖??‖. 寻求最优的分类面即使得分类间隔最大化。可以发现间
‖??‖
隔最大等价于2 最小。
因此最优化分类面问题可以表示成如下的约束优化问题,如下:
Min
Φ(??) = ‖??‖ 2
(3-3)
约束条件为:
?? [(?? ? ??) + ??] ? 1 ≥ 0
定义如下 Lagrange 函数:
(3-4)
??(??,??,??) = ‖??‖ ? ∑
2
??
?? ??
?? = 1
?? ? ?? + ??
)
? 1]
(3-5)
式中,
?? 为 Lagrange 乘子。为了求得函数式(3-5)的最小值,我们对
??,??,??
分别求导有:
{
??? ??
= 0 ? ?? = ∑ ?? ?? ?? ??? ?? = 1
??? ??
= 0 ? ∑ ?? ?? = 0 ??? ?? = 1
???
= 0 ? ?? ?? ?? ? ?? + ?? ? 1 ???
= 0
(3-6)
由式(3-6)和(3-2)可将上述的最优化分类面的求解问题转化为一个凸二次规划 寻优的对偶问题,如下:
???? ?? ?? ?? ?? ?????? ???????? ?? ??????????? ,??
??
?? ?? ?? ?? ?? ??
??
?? ??
?
??
?
?? ?? ??
??
?
?
?
??
?? ,??
?? ,?? 0,?? =? 1,?? = 1
?? = 0
??
??
??
您可能关注的文档
最近下载
- SYT 5547-2000螺杆钻具使用、维修和管理.pdf
- 第三方产品节能环保ccc证书---服务器.docx VIP
- 一种连续酶解制备蛋白肽的系统及工艺.pdf VIP
- (高清版)B-T 40815.2-2021 电气和电子设备机械结构 符合英制系列和公制系列机柜的热管理 第2部分:强迫风冷的确定方法.pdf VIP
- 2025幼儿园园级家委会ppt全新 .pdf VIP
- PEP人教版六年级下册英语全册导学案.pdf VIP
- 鲁科版六年级上生物思维导图.pptx
- 电商运营方案电商运营方案.pptx VIP
- 计数型MSA测量系统分析报告(模板).xls VIP
- 发展低空经济课件.pptx VIP
文档评论(0)