- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第8章 支持向量机1
学习目标理解SVM的基本原理掌握Scikit-learn库实现SVM分类的基本方法122
目录页支持向量机38.1基本原理8.2应用实例
引言支持向量机(SupportVectorMachine)由弗拉基米尔.瓦普尼克(VladimirNaumovichVapnik)在1955年提出,其基本思想在于根据最大化样本分类间隔准则对两类样本进行线性分类,同时可利用特征空间变换、两类分类器组合等方式较好地解决样本非线性可分、多类分类等问题,具有较强的泛化能力。此外,支持向量机在样本较少的情况仍然可表现出较好的性能,在许多场合中可较好地弥补以数据驱动为特点的深度学习方法的不足。支持向量机不仅可以用于分类问题,还可以用于回归问题,具有泛化性能好、适合小样本和高维特征等特点,支持向量机是深度学习技术出现之前最好的分类算法,在过去20多年里被广泛应用于数据分析和模式识别的各个领域。4
8.1基本原理感知机(Perceptron)算法由弗兰克.罗森布拉特(FrankRosenblatt)在1958年提出,具有简单而易于实现的优点,是神经网络与支持向量机的基础,其前提是数据集线性可分。感知机是根据输入实例的特征向量x对其进行二类分类的线性分类模型,其目标是求得一个能够将训练集正实例点和负实例点完全正确分开的边界,称为分离超平面。5
8.1基本原理?6
8.1基本原理感知机采用的最优化算法是随机梯度下降法,感知机学习算法分为原始形式和对偶形式,算法不仅简单且易于实现,其思想是先任意选取一个超平面,然后通过梯度下降法不断极小化目标函数。一次随机选取一个误分类点使其梯度下降。7
8.1.1数学模型支持向量机旨在确定一条最优直线以最大化样本边界线之间距离(即分类间隔)的原则将两类样本正确分开(即两类样本的边界线距离样本分类界线尽可能远),其中,每类样本中位于相应边界线上的样本或距离样本分类界线最近的样本称为“支持向量”,其用于确定两类样本之间的距离及最优样本分类界线。8(a)多分界线(b)样本距离最大分界线(c)非样本距离最大分界线
8.1.1数学模型?9
8.1.1数学模型?10
8.1.1数学模型?11
8.1.1数学模型?12
8.1.2核函数?13
8.1.2核函数14图8-2低维特征空间向高维特征空间的非线性映射?
8.1.2核函数?15
8.1.2核函数?16
8.1.2核函数?17
8.1.2核函数?18
8.1.2核函数在选取核函数时,通常采用的方法包括:①针对问题特点利用专家知识选择核函数。②采用交叉验证的方法测试不同核函数的精度以确定最优者。③通过组合不同核函数的方式提高SVM的性能。19
8.2应用实例Scikit-learn库包含SVC、NuSVC与LinearSVC三个分类模块(SVC与NuSVC基本类似,其主要区别在于损失度量方式不同,而LinearSVC仅用于线性可分样本)与SVR、NuSVR与LinearSVR三个回归模块(其区分与SVC、NuSVC与LinearSVC类似),其导入方式如下:fromsklearn.svmimportSVCfromsklearn.svmimportSVR20
8.2应用实例函数原型如下:SVC(C=1.0,kernel=rbf,degree=3,gamma=auto,coef0=0.0,shrinking=True,probability=False,tol=0.001,cache_size=200,class_weight=None,verbose=False,max_iter=-1,decision_function_shape=ovr,random_state=None)SVR(kernel=rbf,degree=3,gamma=auto_deprecated,coef0=0.0,tol=0.001,C=1.0,epsilon=0.1,shrinking=True,cache_size=200,verbose=False,max_iter=-1)21
8.2.1参数分析在利用SVM解决具体分类或回归问题时,通过需要根据相关数据的分布形态选择合理的核函数、C与gamma值等参数并对相关结果进行可视化,进而提高分类或回归问题求解的可靠性与精度。(1)问题描述首先构造两类样本,然后利用SVM对其进行分类与可视化,具体要求如下:①绘制不同核函数、C与gamma值时相应的分类界线。②显示样本分类结果及相应的支持向量。(2)编程实现见8.2.1参数分析.py2
您可能关注的文档
- 机器学习原理与应用课件 第1章 概述.pptx
- 机器学习原理与应用课件 第2章 特征工程.pptx
- 机器学习原理与应用课件 第3章 线性回归.pptx
- 机器学习原理与应用课件 第4章 Logistic回归.pptx
- 机器学习原理与应用课件 第5章 朴素贝叶斯.pptx
- 机器学习原理与应用课件 第6章 K近邻.pptx
- 机器学习原理与应用课件 第7章 决策树.pptx
- 机器学习原理与应用课件 第9章 K均值聚类.pptx
- 机器学习原理与应用课件 第10章 高斯混合模型.pptx
- 机器学习原理与应用课件 第11章 人工神经网络.pptx
- 2024年全球及中国人工智能AOI晶圆检测系统行业头部企业市场占有率及排名调研报告.docx
- “运动少年,健康成长” 儿童体育教育商业计划书.docx
- 2025年安徽林业职业技术学院单招职业技能测试题库有完整答案.docx
- “生态养老,健康生活” 生态养老基地商业计划书.docx
- 2024年全球及中国军事大众通知系统行业头部企业市场占有率及排名调研报告.docx
- 学校监控中心可行性报告.docx
- 2024年全球及中国无结网行业头部企业市场占有率及排名调研报告.docx
- 2024年全球及中国果树肥料行业头部企业市场占有率及排名调研报告.docx
- 2024年全球及中国细胞灌装系统行业头部企业市场占有率及排名调研报告.docx
- 广州光伏项目可行性报告.docx
文档评论(0)