数据挖掘方法——关联规则(自己整理)演讲稿.pptVIP

  • 1
  • 0
  • 约6.89千字
  • 约 11页
  • 2020-07-02 发布于湖北
  • 举报

数据挖掘方法——关联规则(自己整理)演讲稿.ppt

精选 Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * 精选 Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * Copyright ? 2009, MANAGEMENT SCIENCE ASSOCIATES, INC. * 一、关联规则概念 二、关联规则应用领域 三、关联规则挖掘的过程 四、关联规则的分类 五、关联规则挖掘的相关算法 六、关联规则的优缺点 精选 一、关联规则概念 关联分析(Association analysis):就是从给定的数据集发现频繁出现的项集模式知识(又称为关联规则,association rules)。 两个或两个以上变量的取值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。 关联分析的目的:找出数据库中隐藏的关联网。一般用Support(支持度)和Confidence(可信度)两个阀值来度量关联规则的相关性,引入lift(提高度或兴趣度)、相关性等参数,使得所挖掘的规则更符合需求。 精选 一、关联规则概念 规则就是一个条件和一个结果的和:If condition then result。 1. Support(支持度):是一个元组在整个数据库中出现的概率。 Support=P(condition and result )。 (1) 如 :if A then B。则它的支持度Support=P(A and B) 2. Confidence(可信度):它是针对规则而言的。 Confidence=p(condition and result)/p(condition)。 (2) 如:If B and C then A。则它的可信度Confidence=p(B and C and A)/p(B and C)。 把满足最小支持度阈值和最小置信度阈值的规则成为强规则。项的集合称为项集(itemset),包含K个项集称为K-项集,如果项集满足最小支持度,则称它为频繁项集。 3. Lift(提高率或兴趣度):使得所挖掘的规则更符合需求。 Lift=p(condition and result)/(p(condition)*p(result))。 (3) 当Lift大于1的时候,这条规则就是比较好的;当Lift小于1的时候,这条规则就是没有很大意义的。 Lift越大,规则的实际意义就越好。 精选 二、关联规则应用领域 目前,

文档评论(0)

1亿VIP精品文档

相关文档