决策树技术分类.docxVIP

  • 6
  • 0
  • 约4.56千字
  • 约 9页
  • 2016-12-19 发布于北京
  • 举报
决策树分类技术研究 [摘 要】 决策树分类是一种重要的数据分类技术。该文通过对决策树分类方法的研究,进一步讨论了实际使用过程中决策树学习出现的常见问题的解决方法。为实际应用提供了依据。【关健词】 决策树;分类1 引言数据分类是数据挖掘中的一个重要问题,是一种有效的KDD分析方法。数据分类通过分析训练集中的数据,对类建立分类模型,然后利用这个分类模型,把数据库中的数据项映射到给定类别中。近年来,数据分类技术已被广泛、有效地应用于科学实验、医疗诊断、气象预报、信贷审核、商业预测等领域,引起了工业界和学术界的关注。依据其采用的分类模型,数据分类技术主要可分为:机器学习方法(如决策树归纳)、统计方法(如贝叶斯分类和贝叶斯网络)、神经网络方法、遗传算法、粗糙集和模糊逻辑技术等。上述技术中,决策树技术是利用最广泛的分类技术。它有以下优点:首先,决策树方法结构简单,便于人们理解;其次,决策树模型效率高,对训练集数据量较大的情况较为适合;第三,决策树方法通常不需要受训数据外的知识;第四,决策树方法具有较高的分类精确度。同时决策树技术也有一些不足,如对于大型数据库的可伸缩性问题、对于非平衡数据进行分类时,剪枝会造成精确率的降低等。本文主要阐述了决策树分类的基本概念、算法以及实际使用中如何解决某些常见的问题,如:测试属性选择的度量标准、连续属性的离散化处理、处理缺少属性值、树剪枝与避免过度拟合、分类法

文档评论(0)

1亿VIP精品文档

相关文档