- 7
- 0
- 约2.7千字
- 约 16页
- 2016-03-24 发布于湖北
- 举报
* 第十二讲 决策树(2) * 对缺失数据的处理 决策树的建模过程会忽略因变量缺失的观测,但是决策树可以有效地处理自变量的缺失值。 在划分节点t时,如果训练数据集中自变量xr存在缺失值,那么,根据xr缺失的观测被归入哪一个子节点,S中原有的使用xr的每一个候选划分都变成H个候选划分; 最简单的做法是在划分节点时将划分变量缺失的所有观测归入同一个子节点。 还增加一些这样的候选划分:将xr缺失的观测归入一个子节点,而将其它所有观测归入另外H-1个子节点。 新的候选划分集生成后,可再从中选择最优划分。 * 对缺失数据的处理 这样处理缺失数据,相当于: 对名义变量而言将缺失值看作一个单独的类别,而对定序或连续变量而言,将缺失值看作同一个未知的数值。 但是,对xr缺失的那些观测,这种做法完全忽视了其它自变量可能含有的关于xr的信息,因而不太妥当。 * 对缺失数据的处理 另一种更为妥当的处理自变量缺失值的方法是使用替代划分规则(surrogate splitting rule)。 假设节点t的最优划分规则使用了自变量xr,我们称该划分规则为主划分规则(main splitting rule ),称xr为主划分变量。 xr值缺失的观测观测不是立即被归入接受缺失值的子节点,而是先使用第一替代规则进行划分,如果第一替代规则使用的变量也缺失,则使用第二替代规则进行划分,如
您可能关注的文档
- 市场理论分析.ppt
- 市场理论竞争分析.ppt
- 市场轮廓理论分析.ppt
- 市场失灵和微观经济政策(完整版)分析.ppt
- 市场失灵论分析.ppt
- 市场失灵邮箱分析.ppt
- 市场失灵与公共财政分析.ppt
- 市场失灵与环境问题分析.ppt
- 市场失灵与政府干预理论分析.ppt
- 市场失灵与政府行为分析.ppt
- 2025年下半年小学教师资格考试简答题汇总.pdf
- 护理教学比赛资源整合.pptx
- 2022泰和安消防 JTGB-HM-TX3H01 JTGB-HM-TX3H02 TGB-HM-TX3H03 系列点型红外火焰探测器.docx
- 2025年驾驶证资格考试最新最全交通标志大全.pdf
- 护理教学理念:更新与发展.pptx
- 2025年新驾考科目一巧记速记口诀(全国通用).pdf
- 2025年一级建造师《项目管理》黄金预测考点【打印版】.pdf
- 证券公司高级管理人员资质测试章节练习-第一部分综合类第六章至七章:证券投资基金法、信托法.pdf
- 护理教学研究:方法与成果.pptx
- 麻纺车间设备更新准则.docx
最近下载
- 2025年互联网营销师元宇宙用户数据隐私与安全保护专题试卷及解析.pdf VIP
- 2023年 春风450MT原版中文维修手册.pdf
- 2025年信息系统安全专家DMZ非军事区部署专题试卷及解析.pdf VIP
- 教师技能比赛试题及答案.docx VIP
- 2026年甘肃省金昌市第一批引进高层次和急需紧缺人才73人考试参考试题及答案解析.docx VIP
- 2025年演出经纪人国际版权谈判专题试卷及解析.pdf VIP
- 2025年无人机驾驶员执照无人机环境适应性维护(防水、防尘、防高低温)专题试卷及解析.pdf VIP
- 2025年房地产经纪人独家代理协议全流程综合案例分析专题试卷及解析.pdf VIP
- 山东省青岛市西海岸新区2024-2025学年七年级下学期期末生物试题.pdf VIP
- 二级公路毕业设计说明书.doc VIP
原创力文档

文档评论(0)