决策树技术研究与应用
摘 要
数据挖掘是当前涉及统计学、人工智能、数据库等学科的热门研究领域,是从数据中提取人们
感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。
分类是数据挖掘的一个重要分支,分类能找出描述数据类或概念的模型,以便能使用模型预测
类来标记未知的对象类。基于决策树的分类技术,与其他分类技术相比,具有很多优点:决策树更
容易被用户理解;生成决策树的效率更高、更适合大训练集;决策树的生成算法不需要除训练集以
外的额外信息;可以提供更好的精确度。当然决策树也有缺点:一方面,它无法删除带噪声的不相
关的属性;另一方面,大多数决策树被限制在每个节点上只检验单个属性。
本文针对分类中条件属性较多时,其中的个别条件属性对分类不具有影响的情况,讨论了使用
决策树技术的简约办法,为更有效的进行数据挖掘在方法层面上提供了支持。
关键词: 数据挖掘 决策树 分类技术 条件属性
原创力文档

文档评论(0)