- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第5章其他基础监督学习方法
学习目标理解样条模型的函数形式、使用场景及其实现方法了解广义可加模型的函数形式熟悉支持向量机的函数形式、使用范围及其实现方法了解核技巧的使用方法掌握K近邻分类器的实现方法、使用范围及其实现方法
回归样条模型?
回归样条模型?
回归样条模型
回归样条模型回归样条模型可能遇到的问题有大量参数需要估计函数在节点处可能出现不连续样条回归模型的限制条件函数的0到d-1阶导数在节点处连续线性函数:函数本身在??点连续二次函数:整个函数在??点连续并且一阶可导自然样条:??小于最小的节点或是大于最大节点时??与??的函数呈线性关系
回归样条模型节点的选择节点数量及位置在模型训练前决定均匀的在特征的取值范围进行设置例如:特征的25%,中位数,以及75%处各设置一个节点使用模型验证方法选择最佳节点位置
平滑样条模型?
广义可加模型(GAM)?
支持向量机(SVM)支持向量机简介一种广泛应用的监督学习算法主要用于处理分类问题,也可用于回归问题(支持向量回归,SVR)基本思想不计算误差较小的数据点,尽量减少误差较大的数据点中的误差设定一个边界,误差小于边界的忽略,误差大于边界的计算入总误差与回归的关系支持向量机:使用另一种损失函数的逻辑回归支持向量回归:使用另一种损失函数的线性回归
支持向量机的代价函数?
支持向量机的代价函数
支持向量机的核技巧核技巧介绍核技巧帮助我们在高维空间中找到分类边界不必显式增加特征的数量,降低计算复杂度可以在其他多种机器学习中应用例:一维空间无法找到线性决策边界,映射到二维空间则可以核技巧帮助我们完成将低维的数据像高维空间进行投射,并在高维空间中找到分类边界
支持向量机的核技巧一维空间无法找到线性决策边界
支持向量机的核技巧二维空间可以找到分类边界
支持向量机的核技巧?
支持向量机的核技巧?
K近邻分类器(KNN)K近邻分类器简介简单的非参数方法不需要一个固定的模型函数找到与数据最近的k个数据,用这些数据的目标变量y的平均值作为预测核心思想:如果两个数据点有相似的特征??那么他们的目标变量??也会类似
K近邻分类器(KNN)?
程序实现:平滑样条模型导入库导入np,用于生成数据导入scipy.stats用于生成随机数导入scipy.interpolate用于平滑样条拟合导入matplotlib.pyplot用于结果的可视化
程序实现:平滑样条模型?数据拟合通过调整平滑参数s参数来达到调整拟合函数的平滑度
程序实现:平滑样条模型展示拟合结果
程序实现:平滑样条模型
程序实现:支持向量机与K近邻分类器导入库使用pandas存储数据导入sklearn.svm中的支持向量机的分类模块(SVC)导入sklearn.neighbors中导入KNN分类器模块导入sklearn库中的标准化处理模块,用于对数据进行标准化处理导入sklearn中的metrics模块,用于对模型表现进行评估
程序实现:支持向量机与K近邻分类器存储特征和目标变量使用每列数据的中位数填充缺失值数据读取及处理读取数据;定义一个特征列表,包含四个特征名:
程序实现:支持向量机与K近邻分类器数据标准化创建一个StandardScaler对象,用于对数据进行标准化处理使用scaler的fit方法计算数据集train_x的平均值和标准偏差使用transform方法对train_x中的特征数据进行标准化处理将标准化处理后的数据train_x_standardized转化为DataFrame格式并将结果存储在train_x_standardized中
程序实现:支持向量机与K近邻分类器训练SVM分类器使用sklearn.svm中的SVC模块,创建一个支持向量机分类器对象clf_svm(此处使用线性核)训练模型评估模型表现:准确度定义为正确预测的样本数量除以所有样本量
程序实现:支持向量机与K近邻分类器训练KNN分类器建立一个knn分类器对象knn_clf,考虑5个近邻(n_neighbors=5)模型训练评估模型表现:直接输出模型的分类预测,并计算模型预测准确度
习题程序操作在平滑样条模型中,改变平滑参数??。将??设置为1,5,10,20,并输出拟合结果。在支持向量机程序中,我们使用了线性核。请使用rbf核重新训练模型,并试着将gamma参数设为1,5,10,20。并输出预测表现。在K近邻分类器程序中,将近邻数量调整为3,6,10。输出模型预测表现。K近邻分类器默认使用的是欧几里得距离。请在KNN分类器中
您可能关注的文档
- 《金融大数据分析》-课件 第1章 数据的管理与探索.pptx
- 《金融大数据分析》-课件 第 11 章 监督学习的小结.pptx
- 《金融大数据分析》-课件 第 12 章 主成分分析.pptx
- 《金融大数据分析》-课件 第 19 章.pptx
- 《金融大数据分析》-课件 第2章 数学以及统计学回顾.pptx
- 《金融大数据分析》-课件 第3章 线性回归.pptx
- 《金融大数据分析》-课件 第4章 逻辑回归.pptx
- 《金融大数据分析》-课件 第6章 模型验证.pptx
- 《金融大数据分析》-课件 第7章模型选择与正则.pptx
- 《金融大数据分析》-课件 第8章 决策树.pptx
- 专题02+时事热点(精讲课件)2025年中考地理二轮复习讲练测(安徽专用).pptx
- 专题10+经济建设 2025年中考道德与法治二轮复习讲练测(广东专用).pptx
- 专题02+西游记【名著概览】+-+2025年中考语文必读名著演练.pptx
- 专题七+认识国家(课件)-【省心备考】2025年中考地理一轮复习优质课件.pptx
- 第22课《礼记》二则——《大道之行也》(课件)-2024-2025学年八年级语文下册同步备课精品资源.pptx
- 跨学科实践15:制作“龙骨水车”(课件)-2024-2025学年八年级物理下学期项目化课程案例.pptx
- 第13课_辽宋夏金元时期的对外交流(课件)2024-2025学年七年级历史下册同步教学课件.pptx
- 选择题专项讲解——综合类(课件)2025年初中道德与法治中考选择题练习.pptx
- 第21课《庄子》二则——《北冥有鱼》(课件)-2024-2025学年八年级语文下册同步备课精品资源.pptx
- 7.3+感受澳大利亚(第二课时)-2025学年七年级地理下册同步精品课堂(晋教版2024).pptx
最近下载
- 第16讲 光的直线传播-2024年新八年级物理暑假提升自学课讲义(人教版2024)(解析版).docx VIP
- 国际商法教案.docx VIP
- 2025年鼎和财产保险股份有限公司人员招聘笔试备考试题及答案解析.docx
- 飞机发电机讲解.ppt
- 大数据与人工智能智慧树知到期末考试答案2024年.docx
- 2024年广东深圳市龙岗区总工会社会化工会工作者招聘笔试参考题库附带答案详解.pdf VIP
- 2024年贵州省中考适应性考试九年级数学试题和答案详解.docx
- 大学物理实验坐标纸.doc
- 小学低年级数学游戏教学的问题与对策研究——以开福区荷叶小学为例.docx VIP
- 直流电机PWM控制调速系统设计.doc VIP
文档评论(0)