大型数据库中的关联规则挖掘.pptVIP

  • 3
  • 0
  • 约6.25千字
  • 约 33页
  • 2017-05-30 发布于四川
  • 举报
第四章 关联规则挖掘 关联规则挖掘: 从事务数据库,关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。 应用: 购物篮分析、分类设计、捆绑销售等 “尿布与啤酒”——典型关联分析案例 采用关联模型比较典型的案例是“尿布与啤酒”的故事。在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,超市也因此发现了一个规律,在购买婴儿尿布的年轻父亲们中,有30%~40%的人同时要买一些啤酒。超市随后调整了货架的摆放,把尿布和啤酒放在一起,明显增加了销售额。同样的,我们还可以根据关联规则在商品销售方面做各种促销活动。 一、基本概念 给定: 项的集合:I={i1,i2,...,in} T={t1,t2…tn}是数据库中事务的集合,每个事务ti则是项的集合,使得 则 为T中的关联规则。 其中 并且 规则度量:支持度和置信度 对所有满足最小支持度和置信度的关联规则 支持度s是指事务集T中包含 的百分比 置信度c是指T中包含A同时也包含B的事务占包含A的事务的百分比 最小支持度 min_sup 最小置信度 min_conf 强关联规则:如果事务集合T中的关联规则A ?B同时满足support(A?B)min_sup, confidenc

文档评论(0)

1亿VIP精品文档

相关文档