32.Scikfoldcv函数对机器学习模型进行10折交叉验证天桥下的卖艺者
我们在建立数据模型后通常希望在外部数据验证模型的检验能力。然而当没有外部数据可以验证的时候,交叉验证也不失为一种方法。交叉验验证(交叉验证,CV)则是一种评估模型泛化能力的方法,广泛应用中于数证据采挖掘和机器学习领域,在交叉验证通常将数据集分为两部分,一部分为训练集,用于建立预测模型;另一部分为测试集,用于测试该模型的泛化能力。
简单交叉验证:是我们临床论文中最常使用到的,从数据中随机选择中随机选择70%点的数据作为训练集建立模型,30%的数据当做外部数据来验证模型的预测能力。但其最终所得结果与集合划分比率密切相关,不同划分比率结果变异可能较大。该方法在总数据据集并不是非常大的情形下很难达到准确实评模型的目的。留一交叉验证是指:假设在总集合中共有有n个体,每次选取1个体作为测试试集,其余个体作为训练集。总共进行n次训练,取平均值是最终评价指标。留一交叉验证较为可靠靠,在每次模型训练中纳入几度乎所有个体,当总集合中个体数目轨迹的情势下计算时间较长。k折交叉验证可以看成是留一交叉验证的简化版,是将原始数据据随机平均分为k个子集(通常5-10个),每个子集做测试集的同时,其余k-1个子集合并作为训练,进行k次训练,取各评价指标(灵敏度、特异度、AUC等)的平均值。测试通过平均的评价指来降低训练集和测试集划分方式对预测结果的影响,有研究值表明k折评估准准确性高,当k为5或10时在评估准准后性和计算复杂性下综合性能最优。
10折交叉验证是指将原始数据集随机划分为样本数近乎相等的10个子集,轮流将其中的9个合并作为训练集,其余1个作为测试试集。算正确率等评价指标,最终终通过K次试验验后取评价指标的平均值来评估该模型的泛化能力。10折交叉证验证的基本步骤下:(1)原始数据集划分为10个样本量尽可均衡的子集;(2)使用第1个子集作为测试集,第2~9个子集合并作为训练集;(3)使用训练集对模型进行训练,计算多种评价指标在测试集下的结果;(4)重复2~3步流亜,轮将第2~10个子集作为测试集;(5)计算各评价指标的平均值作为最终结果。
代码+视频系列同步发公众号和B站,希望大家多多支持B站账号名称公众号名称
您可能关注的文档
- 数学练习题:电线长度计算与机器生产效率分析.pdf
- 零舞街舞协会章程及介绍.pdf
- 广美室内设计:设计师勤勉智慧与师生交流.pdf
- K折交叉验证在机器学习模型评估中应用.pdf
- 念奴娇·赤壁怀古.pdf
- 深基坑支撑结构施工质量通病防治手册.docx
- 主桥钢结构安装施工关键工序操作手册.docx
- 主桥钢结构安装施工安全技术保证措施 .docx
- 主桥钢结构安装施工质量保证措施.docx
- 贵州省2026届高三上学期核心模拟(一)历史试题含答案.docx
- 人教版九年级英语Unit 4曾害怕课件3a-4c.pdf
- 雅思口语考题回顾:朗阁海外考试研究中心2019年10月10日Part 1考题总结.pdf
- 2026届高三地理一轮复习课件小专题河流袭夺.pptx
- 【名师原创】复习专题5 三角函数 作者:合肥市第八中学 蒲荣飞名师工作室.docx
- 高中数学一轮复习 微专题2 抽象函数.docx
- 高中数学——复习专题4 空间向量与立体几何.docx
- 高中数学一轮复习 微专题3 空间几何体中的截面、轨迹问题.docx
- 高中数学一轮复习 微专题4 空间几何体的最值、范围问题.docx
- 导流洞施工质量通病防治手册.docx
- 江苏省徐州市第一中学、徐市第三中学等五校2026届高三上学期12月月考历史试题含答案.docx
最近下载
- 2025年小区电工个人年终工作总结(5).pptx VIP
- mcgsTPC触摸屏工程还原破解.doc(经核实内容不全) VIP
- 费希尔DVC6200定位器硬件结构(段来华).pptx VIP
- 2025山东潍柴(烟台)新能源动力科技有限公司招聘笔试历年参考题库附带答案详解.docx VIP
- IKEA宜家 FLISAT 福丽萨特(货号102.998.20)安装指南组装说明书.pdf
- 品牌管理(第2版)课件:品牌概述.pptx VIP
- #南京大学商学院企业管理专业研究生培养方案.pdf VIP
- 我国施工合同文本与FIDIC合同、NEC合同和AIA合同.doc VIP
- 2025高中语文课标测试卷(及答案) .pdf
- 大学生创业基础知识培训课件(PPT45页).ppt VIP
原创力文档

文档评论(0)