数据挖数掘的功能及应用作业.docVIP

  • 2
  • 0
  • 约1.09万字
  • 约 11页
  • 2016-12-28 发布于湖南
  • 举报
数据挖掘的其他基本功能介绍 一、关联规则挖掘 关联规则挖掘是挖掘数据库中和指标(项)之间有趣的关联规则或相关关系。关联规则挖掘具有很多应用领域,如一些研究者发现,超市交易记录中的关联规则挖掘对超市的经营决策是十分重要的。 基本概念 设是项组合的记录,D为项组合的一个集合。如超市的每一张购物小票为一个项的组合(一个维数很大的记录),而超市一段时间内的购物记录就形成集合D。我们现在关心这样一个问题,组合中项的出现之间是否存在一定的规则,如A游泳衣,B太阳镜,,但是得不到足够支持。 在规则挖掘中涉及到两个重要的指标: ① 支持度 支持度,显然,只有支持度较大的规则才是较有价值的规则。 ② 置信度 置信度,显然只有置信度比较高的规则才是比较可靠的规则。 因此,只有支持度与置信度均较大的规则才是比较有价值的规则。 ③ 一般地,关联规则可以提供给我们许多有价值的信息,在关联规则挖掘时,往往需要事先指定最小支持度与最小置信度。关联规则挖掘实际上真正体现了数据中的知识发现。 如果一个规则满足最小支持度,则称这个规则是一个频繁规则; 如果一个规则同时满足最小支持度与最小置信度,则通常称这个规则是一个强规则。 关联规则挖掘的通常方法是:首先挖掘出所有的频繁规则,再从得到的频繁规则中挖掘强规则。在少量数据中进行规则挖掘我们可以采用采用简单的编程方法,而在大量数据中挖掘关联

文档评论(0)

1亿VIP精品文档

相关文档