数据库——决策树.docVIP

  • 8
  • 0
  • 约3.77千字
  • 约 10页
  • 2016-04-04 发布于湖北
  • 举报
1 分类算法功能及应用简介 1.1分类技术的方法和意义 数据挖掘(Data Minig , DM)来源于数据库中的知识发现,它可以说是数据库研究中的一个非常有应用价值的新领域,它融合了数据库、人工智能、机器学习、数理统计学、模糊数学等多个领域的理论和技术。从数据分析的观点来看,数据挖掘分为两类:描述性数据挖掘和预测性数据挖掘。描述性数据挖掘以概要方式描述数据,提供数据所具有的一般性质;预测性数据挖掘分析数据,建立一个或一组模型,产生关于数据的预测,包括分类和回归。分类可用于提取描述重要数据的模型或预测未来的数据趋势。 分类技术是数据挖掘的重要分支,它能够对各个行业提供良好的决策支持,对整个社会的发展产生重要而深远的影响。分类的目的是构造一个分类函数或分类模型(分类器),该模型能把数据库中的数据映射到给定类别中的某一个。分类研究在国外发展很快,已有很多的算法和模型。因此,研究数据分类对数据挖掘技术有很大的意义。 用于分类挖掘技术的方法有很多,如决策树方法、遗传算法、贝叶斯网络、粗糙集、k-最临近方法、关联规则方法等等。其中,决策树方法以其算法容易被人理解、易转换成IF-THEN分类规则、效率较高等优点被广泛研究与应用。目前决策树方法中比较流行的算法有ID3、C4.5、CART、SLIQ和SPRINT等。这些算法都是对训练数据样本集建立一棵决策树,利用建好的决策树,对数据进行预测。决

文档评论(0)

1亿VIP精品文档

相关文档