数据挖掘第6章--挖掘频繁模式、关联和相关性.pptxVIP

  • 83
  • 0
  • 约7.97千字
  • 约 45页
  • 2016-11-28 发布于重庆
  • 举报

数据挖掘第6章--挖掘频繁模式、关联和相关性.pptx

数据挖掘第6章--挖掘频繁模式、关联和相关性

数据挖掘与商务智能范勤勤物流研究中心第二章 挖掘频繁模式、关联和相关性1基本概念2频繁项集挖掘方法3模式评估方法目录 第一章 基本概念 购物篮分析: “尿布与啤酒”采用关联模型比较典型的案例是“尿布与啤酒”的故事。在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,超市也因此发现了一个规律,在购买婴儿尿布的年轻父亲们中,有30%~40%的人同时要买一些啤酒。超市随后调整了货架的摆放,把尿布和啤酒放在一起,明显增加了销售额。同样的,我们还可以根据关联规则在商品销售方面做各种促销活动。购物篮分析关联规则表示如果问题的全域是商店中所有商品的集合,则对每种商品都可以用一个布尔量来表示该商品是否被顾客购买,则每个购物篮都可以用一个布尔向量表示;而通过分析布尔向量则可以得到商品被频繁关联或被同时购买的模式,这些模式就可以用关联规则表示(0001001100,这种方法丢失了什么信息?)关联规则的两个兴趣度度量支持度置信度频繁项集、闭项集和关联规则频繁项集、闭项集基本概念k-项集:包含k个项的集合。例如:{牛奶,面包,黄油}是个3-项集项集的频率是指包含项集的事务数如果项集的频率大于最小支持度×D中的事务总数,则称该项集为频繁项集项集X在数据集D中是闭的,即不存在真超项集Y,使得Y与X在D中具有相同的支持度计数,则项集X是数据集D中的闭项集频繁项集、闭项集和关联规则关联规则:基本概念给定:项的

文档评论(0)

1亿VIP精品文档

相关文档