数据挖掘与机器学习(非参数统计)-精.pptVIP

  • 6
  • 0
  • 约1.5万字
  • 约 64页
  • 2016-10-20 发布于湖北
  • 举报

数据挖掘与机器学习(非参数统计)-精.ppt

数据挖掘与机器学习(非参数统计)-精.ppt

* 用决策树归纳分类 决策树 一个类似于流程图的数结构 内部节点表示一个属性上的测试 每个分支代表一个测试的输出 叶结点代表类或类分布 决策树的生成包括两个过程 树的建构 首先所有的训练样本都在根结点 基于所选的属性循环的划分样本 树剪枝 识别和删除哪些反应映噪声或孤立点的分支 决策树的使用:为一个未知的样本分类 在决策树上测试样本的属性值 * Data Mining: Concepts and Techniques * * Data Mining: Concepts and Techniques * 决策树归纳的算法 基本算法 以自顶向下递归的各个击破方式构造决策树 首先,所有的训练样本都在根结点 所有属性都是分类的(如果值是连续的,它们应预先被离散化) 基于所选属性递归的划分样本 在启发式或统计度量的基础上选择测试属性(例如,信息增益) 停止划分的条件 给定节点的所有样本属于同一个类 没有剩余属性可以用来进一步划分样本-使用多数表决来分类叶节点 没有剩余的样本 * 先用决策树,后用神经网络 训练过渡。。。。。解决(项目作业题) * 其每个步骤相关的工作如下表: 业务目标确定 l???????? 对于所有的数据挖掘项目,这并不是自动获得的。许多数据挖掘项目的目标通常是模糊和不清晰的。对于分析人员和决策制定者来说,在任何数据挖掘项目的开始阶段,对业务问题、业务目标以及数据挖掘目的

文档评论(0)

1亿VIP精品文档

相关文档