基于关联规则的购物篮分析.pdfVIP

  • 192
  • 0
  • 约1.52万字
  • 约 5页
  • 2018-05-09 发布于福建
  • 举报
第23卷第4期 四川理工学院学报(自然科学版) Vo1.23 No.4 2010年8月 JournalofSichuanUniversityofScience&Engineering(NaturalScienceEdition) Aug.2010 文章编号 :1673-1549(2010)04-0430-04 基于关联规则的购物篮分析 方玮玮 , (1.合肥工业大学计算机与信息学院,合肥 230009;2.铜陵学院数学与计算机科学系,安徽 铜陵 244000) 摘 要:关联规则研究有助于发现数据库中不同商品之间的联系。其分析结果可以应用于制定营 销策略,寻求最佳的商品货架布局。从关联规则挖掘算法和关联模式的评估两方面对购物篮数据进行 关联分析。 关键词:购物篮;关联规则;频繁项集;Apriori算法 中图分类号:TP182 文献标识码:A 集。如果一个项集包含 k个项,则称它为 k一项集。例 引 言 如,{啤酒,尿布,牛奶 }是一个3一项集。 许多商业企业在 日复一 13的运营中积聚了大量的 项集的一个重要性质是它的支持度计数,即包含特 数据。例如,商场的收银台每天都收集大量顾客购物数 定项集的事务个数。在表 1显示的数据集中,项集 {啤 据 。表 1给出一个这种数据的例子,称作购物篮事务。 酒 ,尿布,牛奶 }的支持度计数为 2,因为只有两个事务同 表中每一行对应一个事务,包含一个唯一标识TID和给 时包含这三个项。 定顾客购买的商品的集合。零售商对分析这些数据很 1.2 关联规则 感兴趣,以便了解顾客的购买行为,可 以使用这些有价 关联规则是形如x—Y的蕴涵表达式,其中x和Y 值的信息来进行市场促销,库存管理等…。 表 1 购物篮事务的例子 是不相交的项集,即xnY=q0。关联规则的强度可以用 TID 项 集 它的支持度和置信度度量。支持度确定规则可以用于 {面包 ,牛奶} 给定数据集的频繁程度,而置信度确定Y在包含 x的事 面包 ,尿布,啤酒,鸡蛋 务中出现的频繁程度 。 牛奶,尿布,啤酒,可乐 支持度是一种重要度量,因为支持度很低的规则可 面包 ,牛奶,尿布,啤酒 面包,牛奶,尿布,可乐 能只是偶然出现。从商务角度来看,低支持度的规则多 通过对关联分析的方法进行研究,发现隐藏在大型 半也不是令人感兴趣的,因为对顾客很少同时购买的商 数据集中的令人感兴趣的联系。所发现的联系用关联 品进行促销可能并无益处。因此,支持度通常用来删去 规则或频繁项集的形式表示。例如,从表 1所示的数据 那些不令人感兴趣的规则。此外,支持度还具有一种期 中可以提取如下规则:{尿布}一 {啤酒 }。该规则表 明 望的性质,可以用于关联规则的有效发现。 尿布和啤酒的销售之间存在着很强的联系,因为很多父 置信度度量通过规则进行推理的可靠性。对于给 亲在购买尿布的同时也购买啤酒。零售商们可以使用

文档评论(0)

1亿VIP精品文档

相关文档