咨询工具决策树算法及应用拓展.pptVIP

  • 3
  • 0
  • 约6.48千字
  • 约 41页
  • 2018-01-18 发布于湖北
  • 举报
咨询工具决策树算法及应用拓展.ppt

决策树算法及应用拓展 内容简介: 概述 预备知识 决策树生成(Building Decision Tree) 决策树剪枝(Pruning Decision Tree) 捕捉变化数据的挖掘方法 小结 概述(一) 传统挖掘方法的局限性 只重视从数据库中提取规则,忽视了库中数据的变化 挖掘所用的数据来自稳定的环境,人为干预较少 概述(二) 捕捉新旧数据变化的目的: 挖掘出变化的趋势 例:啤酒——尿布 阻止/延缓不利变化的发生 例:金融危机——银行的信贷策略 差异挖掘算法的主要思想: 合理比较新/旧数据的挖掘结果,并清晰的描述其变化部分 预备知识一(Building Tree) 基本思想: 用途:提取分类规则,进行分类预测 使用决策树进行分类 决策树 一个树性的结构 内部节点上选用一个属性进行分割 每个分叉都是分割的一个部分 叶子节点表示一个分布 决策树生成算法分成两个步骤 树的生成 开始,数据都在根节点 递归的进行数据分片 树的修剪 去掉一些可能是噪音或者异常的数据 决策树使用: 对未知数据进行分割 按照决策树上采用的分割属性逐层往下,直到一个叶子节点 决策树算法 基本算法(贪心算法) 自上而下分而治之的方法 开始时,所有的数据都在根节点 属性都是种类字段 (如果是连续的,将其离散化) 所有记录用所选属性递归的进行分割 属性的选择是基于一个启发式规则或者一个统计的度量 (如, in

文档评论(0)

1亿VIP精品文档

相关文档