大学计算机基础(李群)论文排版.docxVIP

  • 15
  • 0
  • 约1.83千字
  • 约 4页
  • 2017-07-30 发布于浙江
  • 举报
数据挖掘中决策树算法的最新进展摘 要:概述了传统决策树方法的基本原理和优越性,指出了该方法应用于超大数据集的数据挖掘环境时的局限性;着重分五个方面概括了近年来决策树方法在数据挖掘中的主要进展,并讨论了决策树方法面临的挑战及其发展趋势。关键词:决策树;分类;数据挖掘1 决策树方法概述1.1 决策树学习过程决策树算法的分类学习过程包括两个阶段[1]:树构造(tree building)和树剪枝(tree pruning)。1.1.1树构造阶段决策树采用自顶向下的递归方式:从根节点开始在每个节点上按照给定标准选择测试属性,然后按照相应属性的所有可能取值向下建立分枝、划分训练样本,直到一个节点上的所有样本都被划分到同一个类,或者某一节点中的样本数量低于给定值时为止。1.1.2树剪枝阶段构造过程得到的并不是最简单、紧凑的决策树,因为许多分枝反映的可能是训练数据中的噪声或孤立点。树剪枝过程试图检测和去掉这种分枝,以提高对未知数据集进行分类时的准确性。1.2 决策树方法的主要优点生成一棵决策树是从数据中生成分类模型的一个非常有效的方法。相对于其他分类方法决策树算法应用最为广泛,其独特的优点包括[2]:学习过程中使用者不需要了解很多背景知识,只要训练事例能够用属性—结论的方式表达出来,就能用该算法进行学习;决策树的训练时间相对较少,其它的分类方法如神经网络,即使对小数据集也要花费很多的训练时间

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档