- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
支撑向量机在R软件e1071包的应用.doc
支撑向量机在R软件e1071包的应用
摘要:支撑向量机(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年提出的,与传统的神经网络技术不同,SVM是以统计学习理论为基础,神经网络是以传统统计学习理论为基础。传统统计学的前提条件是由足够多的样本,而统计学习理论是着重研究小样本条件下的统计规律和学习方法的,它为机器学习问题建立了一个好的理论框架。实践证明,建立在统计学习理论上的支撑向量机不仅结构简单,而且技术性能尤其是推广能力明显提高,能解决好大量现实中的小样本学习问题。
关键词:支撑向量机,核函数,机器学习,R软件,e1071;
0 前言
数据分类的主要方法有:神经网络分类方法、决策树分类方法、贝叶斯分类方法、基于关联规则分类方法以及利用数据库技术分类等。其中神经网络分类方法在1995年以前被认为是智能化最高的。1982年美国加州理工学院物理学家J.J.Hopfield提出Hopfield网络模型[1]和1986年Rnmelhart等提出的BP学习算法[2]是两个重要的里程碑,之后人工神经网络取得前所未有的好局面。但是需要趋于无穷大的渐进理论,可是实际问题中样本数目往往是有限的;因此传统人工神经网络作为机器学习方法,在一般学习理论上很难取得实质性进展。在这种情况下,统计学习理论研究开始得到了重视,在七十年代初V.Vapnik[4-5]等人就开始致力于统计学习理论研究。1995年V.Vapnik等人运用统计学习理论对神经网络进行研究,创立了一种全新的通用学习方法――支撑向量机(SVM),已经表现出很多优点。
1 支撑向量机的介绍
支撑向量机(SVM)是通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。通俗的来说,它是一种二类分类模型,基本模型定义成特征空间上的间隔最大的线性分类器,也就是支撑向量机的学习策略便是间隔最大化,最终可以转化为一个凸二次规划问题的求解。
下面举一个简单的例子,一个二维平面(一个超平面,在二维空间中的例子就是一条直线),如下图所示,平面上有两种不同的点,分别用两种不同的颜色表示,一种为红颜色的点,另一种为蓝颜色的点,红颜色的线表示一个可行的超平面。
a b c d
图1
从图1a中可以看出,这条红颜色的线把红颜色的点和蓝颜色的点分开了。而红颜色的线就是我们上面所说的超平面,即超平面将两种不同颜色的数据点分隔开来,在超平面一边的数据点所对应的 全是-1,而在另一边全是1。
我们可以令分类函数 。显然如果 ,那么是位于超平面上的点。我们可以要求对所有满足 的点,其对于的 等于-1,而 则对应 的数据点。也就是图1b所示。
对一个数据点进行分类,当它的margin越大的时候,分类的confidence越大。对于一个包含 个点的数据集,我们可以很自然地定义它的margin为所有的这 个点的margin值中最小的那个。于是,为了使得分类地confidence高,我们希望所选择的超平面能够最大化这个margin值。即图1c所示。
两个支撑着中间的gap的超平面,它们到中间的纯红线separating hyper plane的距离相等,即我们所能得到的最大的几何间隔,而“支撑”这两个超平面的必定会有一些点,而这些“支撑”的点便叫做支撑向量。即图1d所示。
2 深入了解SVM
我们可以把支撑向量机从现行可分到线性不可分。但是到目前为止,我们的支撑向量机还比较弱,只能处理线性的问题,但是,如果在得到对偶形式之后,通过核函数推广到非线性的情况就变成了一件非常容易的事情。
对于非线性的情况,支撑向量机的处理方法是选择一个核函数通过将数据映射到高维空间,来解决在原始空间中线性不可分的问题。核函数通过把数据映射到高维空间来增加线性学习器的能力,使得线性学习器对偶空间的表达方式让分类操作更具灵活性和可操作性。因为训练数据一般是不会独立出现的,它们总是以成对样例的内积形式出现,而用对偶形式表示学习器的优势为在该表示中可调参数的个数不依赖输入属性的个数,通过使用恰当的核函数来替代内积,可以隐式的将非线性的训练数据映射到高维空间,而不增加可调参数的个数。最后引用一个例子举例说明核函数解决非线性问题的直观效果。
若农场主圈养了一批羊群,为预防狼群袭击羊群,需要搭建一个篱笆把羊群围起来。但是篱笆应该建在哪里呢?这时候就要依据羊群和狼群的位置建立一个“分类器”,比较下面几种不同的分类器,我们可以看到支撑向量机完成了一个很完美的解决方案。
3 支撑向量机在R软件中的实现
R是一个有
您可能关注的文档
- 探讨给排水工程规划及有关问题.doc
- 探讨绿色建筑节能新材料在现代城市发展中的应用.doc
- 探讨耐火材料加热炉的发展及应用.doc
- 探讨节能环保下的高层建筑绿色施工技术.doc
- 探讨计算机模拟在压铸技术中的应用现状.doc
- 探讨计算机网络故障处理与网络维护.doc
- 探讨超声在有机化学中的研究情况.doc
- 探讨软启动器在带式输送机中的应用.doc
- 探讨辣椒高产种植技术.doc
- 探讨通信系统中射频功率测量的应用.doc
- 2025年智能电网柔性直流输电技术在我国西部地区应用前景.docx
- 7.2 弹力-人教版八年级物理下册.pptx
- 2025年智能电网柔性直流输电技术在智能变电站中的应用研究.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化存储中的应用.docx
- 2025年智能电网柔性直流输电技术在新能源并网中的应用研究.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化控制中的应用.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化预测中的应用.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化服务中的应用.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化运维中的应用.docx
- 2025年智能电网柔性直流输电技术智能化保护系统研究.docx
最近下载
- 英语A级2013年6月试题.docx VIP
- 亲子沟通方法ppt课件.pptx VIP
- DB23T 3758-2024 水稻立体育秧智慧工厂智能环境控制技术规范.docx VIP
- 中国美女最多五个地区第1名真是让人大跌眼镜.doc VIP
- (正式版)DB23∕T 3758-2024 《水稻立体育秧智慧工厂智能环境控制技术规范》.pdf VIP
- 《司马光》PPT课件-司马光ppt公开课.pptx VIP
- 2025主题班会-《心怀感恩与爱同行》感恩教育 课件(共34张PPT内嵌视频).pptx VIP
- 产教评技能生态链:内涵解析、价值意蕴与运行机制研究.docx VIP
- 《司马光》学习单.docx VIP
- “懂能会”让员工安全履责落地培训课件.pdf VIP
原创力文档


文档评论(0)