决策树技术研究与应用.pdf

决策树技术研究与应用 摘 要 数据挖掘是当前涉及统计学、人工智能、数据库等学科的热门研究领域,是从数据中提取人们 感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。 分类是数据挖掘的一个重要分支,分类能找出描述数据类或概念的模型,以便能使用模型预测 类来标记未知的对象类。基于决策树的分类技术,与其他分类技术相比,具有很多优点:决策树更 容易被用户理解;生成决策树的效率更高、更适合大训练集;决策树的生成算法不需要除训练集以 外的额外信息;可以提供更好的精确度。当然决策树也有缺点:一方面,它无法删除带噪声的不相 关的属性;另一方面,大多数决策树被限制在每个节点上只检验单个属性。 本文针对分类中条件属性较多时,其中的个别条件属性对分类不具有影响的情况,讨论了使用 决策树技术的简约办法,为更有效的进行数据挖掘在方法层面上提供了支持。 关键词: 数据挖掘 决策树 分类技术 条件属性

文档评论(0)

1亿VIP精品文档

相关文档