第3章 分类.pdf

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 分类

第3章分类 3.1 分类与预测 分类: 预测分类标号 预测: 建立连续值函数模型 典型应用 数据分类—一个两步过程 模型建立: 描述预定的数据类集 模型使用:为了将来或未知的对象分类 分类过程(1):模型建立 分类算法 训练数据 NAME RANK YEARS TENURED 分类规则 Mike Assistant Prof 3 no Mary Assistant Prof 7 yes Bill Professor 2 yes Jim Associate Prof 7 yes IF rank = ‘professor’ Dave Assistant Prof 6 no OR years 6 Anne Associate Prof 3 no THEN tenured = ‘yes’ (2): 模型 分类规则 测试数据 新数据 (Jeff, Professor, 4) NAME RANK YEARS TENURED Tom Assistant Prof 2 no Tenured? Merlisa Associate Prof 7 no George Professor 5 yes Joseph Assistant Prof 7 yes 分类和预测的问题(1): 数据准备 数据清理 相关性分析 数据变换 分类和预测的问题(2):比较分类方法 预测的准确率 速度 强壮性 可伸缩性 可解释性 3.2 用判定树分类 判定树 一个类似流程图的树结构 每个内部节点表示在一个属性上的测试 每个分支代表一个测试输出 每个树叶节点代表类或类分布 判定树的产生包含两个方面 树的构造 树的剪枝 判定树的使用: 对未知样本分类 样本的属性值在判定树上测试 输出: 概念“buys_computer” 的判定树 age? =30 30..40 overcast 40 student? yes credit rating? no yes excellent fair no yes no yes 判定树归纳算法 基本算法(贪心算法) 自顶向下递归的各个击破方式构造判定树

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档