- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
缺失值处理决策树
决策树缺失值处理现实应用中,经常会遇到属性值“缺失”(missing)现象,如果仅使用无缺失的样例?对于数据量不太大的样本集,是对数据的极大浪费。 ? ? ?补充属性缺失值:如前所述。几种处理方式:(1)忽略这些缺失属性的样本。(2)给缺失值赋予该属性的均值或者最常用的值。(3)给缺失值赋予与其同类样本中该属性的最常用的值。(4)为缺失值的每个可能值赋予一个概率。
决策树缺失值处理2. 不补充属性缺失值对于带缺失值的样本,需解决3个问题:Q1:当开始决定选择哪个属性用来进行分裂时,如何计算其划分度量,如信息增益率?Q2:一个属性已被选择,那么在决定分支的时候如果样本在该属性上存在缺失,该属性该如何处理分支?Q3:当决策树已经生成,但预测样本缺失了某些属性,这些属性该如何处理? ? ? ?
决策树缺失值处理 ? ? ?不补充属性缺失值:计算增益或者增益率时根据缺失属性样本个数所占的比率对增益/增益率进行“打折”。Q1:如何进行分裂属性选择?在属性a上没有缺失的样本子集无缺失值样本所占的比例
决策树缺失值处理Q1:如何进行分裂属性选择? ? ? ?以属性退税为例:无缺失的样本包含编号{1,2,3,4,5,7,8,9,10}?属性退税有两个属性值 {Yes,No}???
决策树缺失值处理Q1:如何进行分裂属性选择? ? ? ?类似地,可计算出所有属性在D上的信息增益为???假设以“婚姻状态”进行分裂,下面考虑如何处理分支
决策树缺失值处理忽略这些样本不忽略的做法是如何?Q2:如何进行属性分裂分支处理?婚姻状态已婚离 婚单身
决策树缺失值处理2.1 单独为属性缺失的样本划分一个分支子集。Q2:如何进行属性分裂分支处理?婚姻状态已婚离 婚单身
决策树缺失值处理2.2 把属性缺失的样本分配给所有子结点,并在不同分支中为该样本赋予不同的 值。Q2:如何进行属性分裂分支处理?婚姻状态已婚离 婚单身???
决策树缺失值处理填充缺失值如果有单独的缺失分支,依据此分支;Q3:测试样本存在属性缺失问题,该如何处理?测试数据婚姻状态已婚离 婚单身
决策树缺失值处理在属性节点的分支上,遍历属性节点的所有分支,探索可能所有的分类结果,然后把这些分类结果结合起来一起考虑,按照概率决定一个分类。Q3:测试样本存在属性缺失问题,该如何处理?婚姻状态已婚离 婚单身???测试数据
决策树缺失值处理待分类样本在到达属性节点时就终止分类,然后根据此时该节点所覆盖的叶子节点类别状况为其分配一个发生概率最高的类。Q3:测试样本存在属性缺失问题,该如何处理?婚姻状态已婚离 婚单身???测试数据
THANKS
您可能关注的文档
最近下载
- 施工过程中应急设备配置与管理方案.docx
- 合规-国有企业合规管理体系建设实务讲座(80页).pptx VIP
- 无人机智能巡航路面病害检测方法、无人机和检测系统.pdf VIP
- 23S519小型排水构筑物图集_可搜索.pdf VIP
- 智慧工地系统介绍PPT(共友).pptx VIP
- 生鲜商品配置(按月份).xls VIP
- 2025年新人教版语文3年级上册全册课件.pptx
- 《JB-QGL-TX3016AJB-QTL-TX3016A火灾报警控制器(联动型)安装使用说明书(Ver.1.3,2016.11 )》.pdf VIP
- 大连高金18T操作说明书.pdf
- 施工组织总体设想、方案针对性及施工段划分.doc VIP
文档评论(0)