2019年决策树培训课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2019年决策树培训课件

Data Mining Tool -Decision Tree 福建省粒计算及其应用重点实验室 赵红 2014年11月 提要 数据挖掘简介 决策树的用途 决策树的建立(ID3) C4.5示例 Weka J48源码解析 2 2/11/2019 数据挖掘简介 谁加何种类型的油? 3 姓名 年龄 收入 种族 信誉 电话 地址 加何种油 张三 23 4000 亚裔 良 281-322-0328 2714 Ave. M Supreme 李四 34 2800 白人 优 713-239-7830 5606 Holly Cr Regular 王二 70 1900 西班牙 优 281-242-3222 2000 Bell Blvd. Plus 赵五 18 900 非洲 良 281-550-0544 100 Main Street Supreme 刘兰 34 2500 白人 优 713-239-7430 606 Holly Ct Regular 杨俊 27 8900 亚裔 优 281-355-7990 233 Rice Blvd. Plus 张毅 38 9500 亚裔 优 281-556-0544 399 Sugar Rd. Regular …… 数据挖掘简介 你能判定他/她买计算机的可能性大不大吗? 4 2/11/2019 姓名 年龄 收入 学生 信誉 电话 地址 邮编 买计 算机 张三 23 4000 是 良 281-322-0328 2714 Ave. M 77388 买 李四 34 2800 否 优 713-239-7830 5606 Holly Cr 78766 买 王二 70 1900 否 优 281-242-3222 2000 Bell Blvd. 70244 不买 赵五 18 900 是 良 281-550-0544 100 Main Street 70244 买 刘兰 34 2500 否 优 713-239-7430 606 Holly Ct 78566 买 杨俊 27 8900 否 优 281-355-7990 233 Rice Blvd. 70388 不买 张毅 38 9500 否 优 281-556-0544 399 Sugar Rd. 78244 买 …… 数据挖掘简介 我们拥有什么: Huge amount of data (GTE:1TB/day) 我们需要什么: Information and knowledge 我们应该怎么办: Data mining 5 2/11/2019 排名 挖掘主题 算法 得票数 发表时间 作者 陈述人 1 分类 C4.5 61 1993 Quinlan, J.R Hiroshi Motoda 2 聚类 k-Means 60 1967 MacQueen, J.B Joydeep Ghosh 3 统计学习 SVM 58 1995 Vapnik, V.N QiangYang 4 关联分析 Apriori 52 1994 Rakesh Agrawal Christos Faloutsos 5 统计学习 EM 48 2000 McLachlan, G Joydeep Ghosh 6 链接挖掘 PageRank 46 1998 Brin, S. Christos Faloutsos 7 集装与推进 AdaBoost 45 1997 Freund, Y. Zhi-Hua Zhou 8 分类 kNN 45 1996 Hastie, T Vipin Kumar 9 分类 Naïve Bayes 45 2001 Hand, D.J Qiang Yang 10 分类 CART 34 1984 L.Breiman Dan Steinberg 数据挖掘10大算法 ICDM 2006 Panel (会议的专题讨论)共有145人选出了数据挖掘10大算法。 建立分类模型的一般方法 决策树的用途 新顾客(测试样例),你能帮助公司将这位客人归类吗? 即:你能预测这位顾客是属于“买、不买”计算机的那一类? 又:你需要多少有关这位客人的信息才能回答这个问题? 8 2/11/2019 计 数 年 龄 收 入 学 生 信 誉 归类: 买计算机? 64 青 高 否 良 不买 64 青 高 否 优 不买 128 中 高 否 良 买 60 老 中 否 良 买 64 老 低 是 良 买 64 老 低 是 优 不买 64 中 低 是 优 买 128 青 中 否 良 不买 64 青 低 是 良 买 132 老 中 是 良 买 64 青 中 是 优 买 32 中 中 否 优 买 32 中 高 是 良 买 63 老 中 否 优 不买 1 老 中 否 优 买 决策树的用途 9 2/11/2019 谁在买计算机?

文档评论(0)

wangxue1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档