分类挖掘:决策树幻灯片课件.pptVIP

  • 4
  • 0
  • 约4.94千字
  • 约 65页
  • 2018-12-08 发布于天津
  • 举报
分类挖掘:决策树幻灯片课件.ppt

分类挖掘:决策树;决策树算法概述;1 建立决策树,利用训练样本生成决策树模型。 开始,数据都在根节点 递归的进行数据分片 2 修剪决策树 去掉一些可能是噪音或者异常的数据 3 使用决策树对未知数据进行分类 按照决策树上采用的分割属性逐层往下,直 到一个叶子节点 ;决策树的核心问题;决策树的核心问题;训练集(Train):数据库中为建立模型而被分析的数据元组形成训练集。 训练集中的单个元组称为训练样本,每个训练样本有一个类别标记。一个具体样本的形式可为:( v1, v2, ..., vn; c );其中vi表示属性值,c表示类别。 测试集(Test):用于模型参数的估计,评估分类模型的准确率。 验证集(Validation):用于模型误差的估计。;a.模型训练阶段 训练集 b.使用模型 分类阶段 评估准确率(测试集) 对类标号未知的新 数据分类 ;基本算法 自上而下分而治之的方法 开始时,所有的数据都在根节点 所有记录用所选属性递归的进行分割 属性的选择是基于一个启发式规则或者一个统计的度量 (如, information gain) 停止分割的条件 一个节点上的数据都是属于同一个类别 没有属性可以再用于对数据进行分割 ; 建树阶段 MakeTree (Training Data T) Partition (T)

文档评论(0)

1亿VIP精品文档

相关文档