决策树DTC数据分析及鸢尾数据集分析.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
决策树DTC数据分析及鸢尾数据集分析课案

决策树DTC数据分析及鸢尾数据集分析 一. 分类及决策树介绍 1.分类 ? ? ? ? 分类其实是从特定的数据中挖掘模式,作出判断的过程。比如Gmail邮箱里有垃圾邮件分类器,一开始的时候可能什么都不过滤,在日常使用过程中,我人工对于每一封邮件点选“垃圾”或“不是垃圾”,过一段时间,Gmail就体现出一定的智能,能够自动过滤掉一些垃圾邮件了。 ? ? ? ? 这是因为在点选的过程中,其实是给每一条邮件打了一个“标签”,这个标签只有两个值,要么是“垃圾”,要么“不是垃圾”,Gmail就会不断研究哪些特点的邮件是垃圾,哪些特点的不是垃圾,形成一些判别的模式,这样当一封信的邮件到来,就可以自动把邮件分到“垃圾”和“不是垃圾”这两个我们人工设定的分类的其中一个。 ? ? ? ? 分类学习主要过程如下: ? ? ? ?(1)训练数据集存在一个类标记号,判断它是正向数据集(起积极作用,不垃圾邮件),还是负向数据集(起抑制作用,垃圾邮件); ? ? ? ?(2)然后需要对数据集进行学习训练,并构建一个训练的模型; ? ? ? ?(3)通过该模型对预测数据集进预测,并计算其结果的性能。 2.决策树(decision tree) ? ? ? ? 决策树是用于分类和预测的主要技术之一,决策树学习是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规则的实例中推理出以决策树表示的分类规则。构造决策树的目的是找出属性和类别间的关系,用它来预测将来未知类别的记录的类别。它采用自顶向下的递归方式,在决策树的内部节点进行属性的比较,并根据不同属性值判断从该节点向下的分支,在决策树的叶节点得到结论。 ? ? ? ? 决策树算法根据数据的属性采用树状结构建立决策模型, 决策树模型常用来解决分类和回归问题。常见的算法包括:分类及回归树(Classification And Regression Tree, CART), ID3 (Iterative Dichotomiser 3), C4.5, Chi-squared Automatic Interaction Detection(CHAID), Decision Stump, 随机森林(Random Forest), 多元自适应回归样条(MARS)以及梯度推进机(Gradient Boosting Machine, GBM)。 ? ? ? ??决策数有两大优点:1)决策树模型可以读性好,具有描述性,有助于人工分析;2)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。 ? ? ? ??示例1: ? ? ? ? 下面举两个例子,参考下面文章,强烈推荐大家阅读,尤其是决策树原理。 ? ? ? ??算法杂货铺——分类算法之决策树(Decision tree) - leoo2sk ? ? ? ? 这个也是我上课讲述的例子,引用上面文章的。通俗来说,决策树分类的思想类似于找对象。现想象一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话: ? ? ? 女儿:多大年纪了? ? ? ? 母亲:26。 ? ? ? 女儿:长的帅不帅? ? ? ? 母亲:挺帅的。 ? ? ? 女儿:收入高不? ? ? ? 母亲:不算很高,中等情况。 ? ? ? 女儿:是公务员不? ? ? ? 母亲:是,在税务局上班呢。 ? ? ? 女儿:那好,我去见见。 ? ? ? ??示例2: ? ? ? ? 另一个课堂上的例子,参考CSDN的大神lsldd的文章,推荐大家阅读学习信息熵。 ? ? ? ??用Python开始机器学习(2:决策树分类算法) ? ? ? ??假设要构建这么一个自动选好苹果的决策树,简单起见,我只让他学习下面这4个样本: [python]?view plain?copy? 样本????红?????大??????好苹果???? 0???????1??????1?????????1???? 1???????1??????0?????????1???? 2???????0??????1?????????0???? 3???????0??????0?????????0???? ? ? ? ??示例3: ? ? ? ? 第三个例子,推荐这篇文章:决策树学习笔记整理 - bourneli ? ? ? ? 决策树构建的基本步骤如下: ? ? ? ? 1. 开始,所有记录看作一个节点; ? ? ? ? 2. 遍历每个变量的每一种分割方式,找到最好的分割点; ? ? ? ? 3. 分割成两个节点N1和N2; ? ? ? ? 4. 对N1和N2分别继续执行2-3步,直到每个节点足够“纯”为止。 二. 鸢尾花卉Iris数据集 ? ? ? ? 在Sklearn机器学习包中,集成了各种各样的数

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档