- 12
- 0
- 约2.39千字
- 约 24页
- 2024-05-31 发布于四川
- 举报
第十八讲模型的过分拟合主讲:王彦数据挖掘模型过分拟合和拟合不足分类模型的误差大致分为两种:训练误差:是在训练记录上误分类样本比例泛化误差:是模型在未知记录上的期望误差一个好的分类模型不仅要能够很好拟合训练数据,而且对未知样本也要能准确分类。换句话说,一个好的分类模型必须具有低训练误差和低泛化误差。当训练数据拟合太好的模型,其泛化误差可能比具有较高训练误差的模型高,这种情况成为模型过分拟合模型过分拟合和拟合不足当决策树很小时,训练和检验误差都很大,这种情况称为模型拟合不足。出现拟合不足的原因是模型尚未学习到数据的真实结构。随着决策树中结点数的增加,模型的训练误差和检验误差都会随之下降。当树的规模变得太大时,即使训练误差还在继续降低,但是检验误差开始增大,导致模型过分拟合。模型过分拟合和拟合不足过分拟合导致过分拟合的原因导致过分拟合的原因噪声导致的过分拟合例子:哺乳动物的分类问题十个训练记录中有两个被错误标记:蝙蝠和鲸如果完全拟合训练数据,决策树1的训练误差为0,但它在检验数据上的误差达30%。人和海豚,针鼹误分为非哺乳动物相反,一个更简单的决策树2,具有较低的检验误差(10%),尽管它的训练误差较高,为20%决策树1过分拟合训练数据。因为属性测试条件4条腿具有欺骗性,它拟合误标记的训练纪录,导致对检验集中记录的误分类噪声导致的过分拟合(例子)噪声导致决策边界的改变缺乏代表性样本导致
您可能关注的文档
- 《材料与社会》选修课考试答案整理PPT.ppt
- 外封式堵漏袋的简介.pptx
- Guyon管尺神经卡压.ppt
- 实验二-凝胶层析法.ppt
- 4.2-地质构造规律.ppt
- 第十一章--配合物结构.ppt
- 第一章-原始社会工艺美术.ppt
- 触觉质感与视觉质感.pptx
- 实验三IIR数字滤波器的设计(参考答案20081207).ppt
- MOS模块产品介绍.pptx
- 统编版二年级语文上册课件《语文园地八》.pptx
- 眼部肌肤护理的日常习惯.pptx
- 第十单元 常见的酸、碱、盐 复习课(酸碱盐的化学性质)课件(内嵌视频)2025-2026学年九年级化学人教版下册.pptx
- 眼部肌肤护理的科学方法.pptx
- 2.4 磁铁能吸什么 课件(内嵌视频)2026-2027学年科学二年级上册苏教版.pptx
- 统编版二年级语文上册课件《阅读18 古诗二首》.pptx
- 科学二下4.12 寻访小动物的家 课件(苏教版2026新教材).pptx
- 煤矿企业各岗位安全生产风险告知.docx
- 第18课《井冈翠竹》课件-统编版语文七年级下册.pptx
- 第二章气体 液体和固体_气体液体固体单元复习课- 课件 -2026-2027学年高二下学期物理粤教版(2019)选择性必修第三册.pptx
最近下载
- 2025-2026学年四川省宜宾市西师大版六年级下册考试数学试题【含答案】.docx VIP
- 矩形菱形正方形单元测试题.docx VIP
- 水电工程动能设计规范,NB_T35061-2015.pdf VIP
- 2026版《煤矿重大事故隐患判定标准》解读与全文逐条学习附讲稿36页.pptx
- 吉J2025-186蒸压加气混凝土板墙体构造.pdf VIP
- DB23T 2950-2021 梓树播种育苗技术规程.docx VIP
- G0206【五年级 下册英语】【人教版】选词填空带答案.pdf VIP
- G0203【二上数学】二年级上册数学通用版《数学寒假作业每日一练共30天》.pdf VIP
- 2026年新能源储能电站储能技术产业链可行性分析报告.docx
- NB_T 11568.9-2024 水电工程岩土试验仪器设备校验规程 第9部分:透水板.docx VIP
原创力文档

文档评论(0)