数据挖掘要点.pptVIP

  • 11
  • 0
  • 约8.03千字
  • 约 36页
  • 2016-04-29 发布于湖北
  • 举报
数据挖掘的技术及应用 数据挖掘概述 关联规则挖掘 什么是关联规则? 关联规则:描述数据库中各数据项之间存在的潜在关系,形式为X ? Y,其中X ? I,Y ? I,且X ? Y=?,X称为规则头(antecedent),Y称为规则尾(consequent)。 项集之间的关联表示如果X出现在一条交易中,那么Y在这条交易中同时出现的可能性比较高。 关联规则就是希望发现事务数据库中不同商品(项)之间的关联,这些规则能够反映顾客的购买行为模式,比如购买某一商品对购买其他商品的影响。例如,80%的顾客如果买了牛奶,通常也会买面包。 应用 发现所有* ?面包的关联规则,促进面包的销售 发现所有牛奶 ? *的关联规则,了解终止牛奶的销售的影响 发现商场里货架A和货架B上商品之间的关联规则,调整商品的布置,提高销售量 关联规则的基本概念 Given: (1)事务/交易数据库 (2)顾客每次购买的商品构成一条事务 (3)每种商品是一个数据项(简称项) I={ii,i2,…,im}是全体数据项的集合 数据项集 (Itemset),简称为项集是由数据项构成的非空集合。项集X包含的元素个数称为项集的长度,长度为k的项集称为k阶项集(k_itemset) D为事务数据库,每个事务T有唯一的TID标识,对应一个项集T,有T ? I。 交易T包含项集X 当且仅当 X ? T 事务(交易)数据库的例子

文档评论(0)

1亿VIP精品文档

相关文档