- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习徐国清支持向量机河南工业职业技术学院
目录支持向量机的概念支持向量机的核函数与参数选择
支持向量机的概念支持向量机(supportvectormachine,SVM)曾经在机器学习界有着近乎「垄断」地位的模型,影响力持续了好多年。直至今日,即使深度学习神经网络的影响力逐渐增强,但SVM在中小型数据集上依旧有着可以和神经网络抗衡的极好效果和模型鲁棒性。
支持向量机的概念下面来说明几个概念线性可分:在数据样本中,如果可以找出一个超平面,将两组数据分开,那么这个数据样本是线性可分的。线性不可分:在数据样本中,没法找出一个能够将两组数据分开的超平面,那么这个数据样本是线性不可分的。分割超平面:将数据样本分割开来的直线或者平面称为分割超平面。
支持向量机的概念间隔:数据点到分割超平面的距离称为间隔。支持向量:离分割超平面最近的那些点称为支持向量。
支持向量机的概念如图所示,直线将红色数据点(图中为深色)和绿色数据点(图中为浅色)完美地分割开了,则称为线性可分。
支持向量机的概念如图所示,我们无法找到一条直线,能将红色数据点(图中为深色)和绿色数据点(图中为浅色)完美地分割开,则称为线性不可分。
支持向量机的概念如图所示,我们可以看到在直线H的两侧分别有H1和H2两条直线,那些正好压在H1和H2上的数据点就是支持向量。中间的直线H(在高维数据中是一个超平面)和所有支持向量之间的距离都是最大的。理论上像直线H这样的决策边界有无数种选择,因为我们还能画出很多条不同的能够把圆点数据和正方形数据进行分割的直线,但是哪一种是最好的分类方式呢?SVM认为靠近决策边界的点(正负样本)与决策边界的距离最大时,才是最好的分类选择,这个距离就是所谓的最大分类间。
支持向量机的概念
支持向量机的核函数与参数选择支持向量机
支持向量机的核函数与参数选择我们很难在二维空间上将圆点数据和五角星数据进行类别的划分,但是如果我们将二维空间变成三维空间就好办了。如果圆点数据是轻飘飘的,可以浮上来;五角星数据是沉甸甸的,会沉下去,这样我们就可以在浮起的圆点数据和沉下去的五角星数据中间找出一个超平面将两类数据进行分割。
支持向量机的核函数与参数选择这种将二维空间变成三维空间的过程就称为将数据投射至高维空间,SVM的核函数就具有这个功能。在SVM中,最常用的把数据投射到高维空间的方法分别是多项式内核(polynomialkernel)和径向基函数(radialbasisfunction,RBF)内核。而RBF内核也被称为高斯内核(gaussiankernel)。
支持向量机的核函数与参数选择在SVM分类器两侧分别有两条虚线,也就是我们找到了一条分割直线(中间的实线)将数据点分成了两类。把SVM的内核换成RBF内核时,会得到右图所示的结果。
支持向量机的核函数与参数选择classsklearn.svm.SVC(*,C=1.0,kernel=rbf,degree=3,gamma=scale,coef0=0.0,shrinking=True,probability=False,tol=0.001,cache_size=200,class_weight=None,verbose=False,max_iter=-1,decision_function_shape=ovr,break_ties=False,random_state=None)
支持向量机的核函数与参数选择参数说明C浮点数,默认=1.0
正则化参数。正则化的强度与C成反比。必须严格为正。此惩罚系数是l2惩罚系数的平方kernel{‘linear’,‘poly’,‘rbf’,‘sigmoid’,‘precomputed’},默认=’rbf’
指定算法中使用的内核类型。它必须是“linear”,“poly”,“rbf”,“sigmoid”,“precomputed”或者“callable”中的一个。如果没有给出,将默认使用“rbf”。degree整数型,默认=3
多项式核函数的次数(poly)。将会被其他内核忽略。gamma浮点数或者{‘scale’,‘auto’},默认=’scale’
核系数包含‘rbf’,‘poly’和‘sigmoid’
如果gamma=scale(默认),则它使用1/(n_features*X.var())作为gamma的值,如果是auto,则使用1/n_features。
在0.22版本有改动:默认的gamma从“auto”改为“scale”。
支持向量机的核函数与参数选择shrinking布尔值,默认=True
是否使用缩小启发式tol浮点数,默认=1e-3
残差收敛条件。cache_size浮点数,默认=200
您可能关注的文档
- 直播复盘WORK73课件讲解.pptx
- 直播筹备授课XXX授课时间XXX07课件讲解.pptx
- 直播筹备授课XXX授课时间XXX07课件讲解.pptx
- 直播策划授课XXX授课时间XXX28课件讲解.pptx
- 直播策划二33课件讲解.pptx
- 直播策划二33课件讲解.pptx
- 执行验收管理确保投产安全Implementacceptancemanagementtoensureproductionsafety73课件讲解.pptx
- 织造印染类非遗概述94课件讲解.pptx
- 知识目标掌握RFID技术概念与系统组成逻辑概念认知理解技术特点与工作原理信号交互流程技术认知熟悉多领域应用及物联网开发价值应用认知了解技术发展趋势与跨技术融合方向趋势认知27课件讲解.pptx
- 知识点1认识母种1什么是母种2从何而来3可用于何处42课件讲解.pptx
最近下载
- 血培养标本采集.ppt VIP
- 沪教版三年级英语下册全册朗读+微课+知识点+教案课件汇总(文末下载)上海牛津3B.pdf VIP
- NBT 35085-2016 水电工程移民安置区工程地质勘察规程.pdf VIP
- (高清版)B-T 39255-2020 焊接与切割用保护气体.pdf VIP
- 政研论文-如何发挥党支部的战斗堡垒作用和党员的先锋模范作用.docx VIP
- 手机外壳注塑模具设计开题报告.doc VIP
- 蒂升电梯MC2-C调试培训资料 2021.pptx
- 物流运输与包装.pptx
- 大数据与法律检索(湖南师范大学)中国大学MOOC(慕课)章节测验试题(答案).pdf
- 湖南省长沙市浏阳市2024-2025学年九年级上学期期末英语试题.docx VIP
原创力文档


文档评论(0)