决策树算法学生.ppt

5.3 决策树算法 决策树算法是分类发现算法中最常见的一种方法。决策树的表现形式是类似于流程图的树结构,在决策树的内部节点进行属性测试,并根据属性值判断由该节点引出的分支,在决策树的叶节点得到结论。内部节点是属性或属性的集合,叶节点代表样本所属的类或类分布。 基于决策树的学习算法在学习过程中不需要用户了解很多背景知识,只要训练样本能够用属性——值的方式表述,就可以使用该算法来学习。 5.3.1 决策树算法概述 决策树算法通过构造决策树来发现数据中蕴涵的分类规则。如何构造精度高、规模小的决策树是决策算法的核心内容。 决策树的构造可以分为以下两步: ? 决策树的生成 ? 决策树的剪枝 一、决策树的生成 决策树的生成是指由训练样本数据集生成决策树的过程。一般情况下,训练样本数据集是根据实际需要由实际的历史数据生成的、有一定综合程度的、用于数据分析处理的数据集。 在决策树的生成过程中,其输入为训练样本数据集,决策树是其最终的输出结果。 决策树: 决策树的每一个决策节点对应着对元组进行分类的一个决策属性,分枝对应着元组按该属性进一步划分的取值特征。叶子节点代表着各个类或类的分布。 决策

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档