网站大量收购独家精品文档,联系QQ:2885784924

第3章决策树学习重点.ppt

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 决策树学习 决策树表示方法 决策树学习的适用问题 基本的决策树学习算法 简介 是一种逼近离散值目标函数的方法 学习得到的函数被表示为一颗决策树 学习得到的决策树也能再被表示为多个if-then规则 此算法是最流行的归纳推理算法之一 成功应用: 医疗诊断 贷款评估 决策树表示法 通过把实例从根节点排列到某个叶子来分类实例 叶子节点即为实例所属的分类 树上的每一个节点指定了对实例的某个属性的测试 该节点的一个后继分支对应于该属性的一个可能值 利用决策树的分类方法 从根节点开始,测试该节点指定的属性 按照给定的实例属性向对应的树枝移动 在以新节点为根的子树上重复过程 例:PlayTennis的决策树 3.3 决策树的适用问题 实例是由“属性-值”(pair)表示 每个属性都去少数离散的值 可扩展到值域为实数的属性 目标函数具有离散的输出值 一般是一个bool型的分类 可扩展到实数值输出的函数,一般不常见 3.3 决策树的适用问题 需要析取的描述 在决策树中取的最终结果即得到析取表达式 训练数据可以包含错误 对错误具有很好的包容力 训练数据可以包含缺少属性值的实例 3.4 基本的决策树学习算法 核心算法ID3:自顶向下的贪婪搜索遍历 贪婪算法:局部最优,不回溯 构造过程: 首先的问题:哪个属性的根节点将被测试? 答:使用统计测试来确定最具分类能力的单独属性 哪个属性是最优的分类属性 用熵度量样例的均匀性 用信息增益度量期望的熵降低 举例:用ID3算法处理PlayTennis问题

您可能关注的文档

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档