数据挖掘-分类方法.pptVIP

  • 17
  • 0
  • 约1.01万字
  • 约 75页
  • 2018-09-04 发布于河北
  • 举报
数据挖掘-分类方法

(二)决策树的基本算法 Generate_decision_tree//根据给定数据集产生一个决策树 输入:训练样本,各属性均取离散数值,可供归纳的候选属性集为:attribute_list。 输出:决策树。 处理流程程: (1)创建一个结点; (2)若该结点中的所有样本均为同一类别C,则 (3)返回N作为一 个叶结点并标志为类别C; (4)若attribute_list为空,则 (5)返回N作为一个叶结点并标记为该结点所含样本中类别个数最多的类别; (6)从attribute_list选择一个信息增益最大的属性test_attribute; (7)并将结点N标记为test_attribute; (8)对于test_attribute中的每一个已知取值ai准备划分结点N所包含的样本集; (9)根据test_attribute=ai条件,从结点N产生相应的一个分支,以表示该测试条件; (10)设si为test_attribute=ai条件所获得的样本集合; (11)若si为空,则将相应叶结点标记为该结点所含样本中类别个数最多的类别; (12)否则将相应叶结点标志为Generate_decision_tree(si,attribute_list-test_attribute)返回值; 2.这个算法递归地应用于每个子节点,直到一个节点上的所有样本都分区到某个类中。 3.到达决策树的叶节点

文档评论(0)

1亿VIP精品文档

相关文档