第3章关联规则挖掘理论和算法(new)资料.ppt

Data Mining: Concepts and Techniques 关联规则挖掘是数据挖掘研究的基础 关联规则挖掘(Association Rule Mining)是数据挖掘中研究较早而且至今仍活跃的研究方法之一。 最早是由Agrawal等人提出的(1993)。最初提出的动机是针对购物篮分析(Basket Analysis)问题提出的,其目的是为了发现交易数据库(Transaction Database)中不同商品之间的联系规则。 关联规则的挖掘工作成果颇丰。例如,关联规则的挖掘理论、算法设计、算法的性能以及应用推广、并行关联规则挖掘(Parallel Association Rule Mining)以及数量关联规则挖掘(Quantitive Association Rule Mining)等。 关联规则挖掘是数据挖掘的其他研究分支的基础。 事务数据库 设I={ i1,i2,…,im }是一个项目(Item)集合,事务数据库D={ t1,t2,…,tn }是由一系列具有唯一标识TID(事务号)的事务组成,每个事务ti(i=1,2,…,n)都对应 I 上的一个子集。 一个事务数据库可以用来刻画: 购物记录: I是全部物品集合, D是购物清单,每个元组 ti 是一次购买物品的集合(它当然是 I 的一个子集)。 如I={ 物品1,物品2,…,物品m };事务数据库D={ t1,

文档评论(0)

1亿VIP精品文档

相关文档