第四章 关联规则.pptxVIP

  • 3
  • 0
  • 约3.27千字
  • 约 50页
  • 2026-06-17 发布于湖南
  • 举报

第四章关联规则;本章内容;购物篮分析

设计产品布局

商品促销策略

;设I={i1,?i2,…,im}是项(Item)的集合。

D是事务(Transaction)的集合(事务数据库)。

事务T是项的集合,且对于每一个事务具有唯一的标识:事务号,记作TID。

设A是I中的一个项集,如果A?T,那么事务T包含A。

;项目(item):

其中的可乐,薯片,面包,啤酒,尿布都称作item。

项集(itemset):

item的集合,例如{可乐,薯片},{可乐,面包}等,每个顾客购买的都是一个项集。

K项集(K-itemset):

含有k个item的项集称为K项集,K-itemset。

;(1)关联规则(AssociationRule)

关联规则是形如A-B的逻辑蕴含式,其中A,B都不为空,且A?I,B?I,并且A?B=?。

(2)支持度(Support):

规则A→B具有支持度S,表示D中事务包含A∪B的百分比,它等于概率P(A∪B),也叫相对支持度。

;

;

(3)置信度(confidence):

规则A→B在事务数据库中具有置信度C,它表示包含项集A的同时也包含项集的概率,即条件概率P(B|A)。因为事务数据库D的规模是一定的。

其中|A|表示数据库中包含项集A的事务个数

;(4)阈值:

为了在事务数据库中找出有用的关联规则,需要由用户确定两个阈值:最小支持度阈值(

文档评论(0)

1亿VIP精品文档

相关文档