- 192
- 0
- 约1.52万字
- 约 5页
- 2018-05-09 发布于福建
- 举报
第23卷第4期 四川理工学院学报(自然科学版) Vo1.23 No.4
2010年8月 JournalofSichuanUniversityofScience&Engineering(NaturalScienceEdition) Aug.2010
文章编号 :1673-1549(2010)04-0430-04
基于关联规则的购物篮分析
方玮玮 ,
(1.合肥工业大学计算机与信息学院,合肥 230009;2.铜陵学院数学与计算机科学系,安徽 铜陵 244000)
摘 要:关联规则研究有助于发现数据库中不同商品之间的联系。其分析结果可以应用于制定营
销策略,寻求最佳的商品货架布局。从关联规则挖掘算法和关联模式的评估两方面对购物篮数据进行
关联分析。
关键词:购物篮;关联规则;频繁项集;Apriori算法
中图分类号:TP182 文献标识码:A
集。如果一个项集包含 k个项,则称它为 k一项集。例
引 言
如,{啤酒,尿布,牛奶 }是一个3一项集。
许多商业企业在 日复一 13的运营中积聚了大量的 项集的一个重要性质是它的支持度计数,即包含特
数据。例如,商场的收银台每天都收集大量顾客购物数 定项集的事务个数。在表 1显示的数据集中,项集 {啤
据 。表 1给出一个这种数据的例子,称作购物篮事务。
酒 ,尿布,牛奶 }的支持度计数为 2,因为只有两个事务同
表中每一行对应一个事务,包含一个唯一标识TID和给
时包含这三个项。
定顾客购买的商品的集合。零售商对分析这些数据很
1.2 关联规则
感兴趣,以便了解顾客的购买行为,可 以使用这些有价
关联规则是形如x—Y的蕴涵表达式,其中x和Y
值的信息来进行市场促销,库存管理等…。
表 1 购物篮事务的例子 是不相交的项集,即xnY=q0。关联规则的强度可以用
TID 项 集 它的支持度和置信度度量。支持度确定规则可以用于
{面包 ,牛奶} 给定数据集的频繁程度,而置信度确定Y在包含 x的事
面包 ,尿布,啤酒,鸡蛋 务中出现的频繁程度 。
牛奶,尿布,啤酒,可乐
支持度是一种重要度量,因为支持度很低的规则可
面包 ,牛奶,尿布,啤酒
面包,牛奶,尿布,可乐 能只是偶然出现。从商务角度来看,低支持度的规则多
通过对关联分析的方法进行研究,发现隐藏在大型 半也不是令人感兴趣的,因为对顾客很少同时购买的商
数据集中的令人感兴趣的联系。所发现的联系用关联 品进行促销可能并无益处。因此,支持度通常用来删去
规则或频繁项集的形式表示。例如,从表 1所示的数据 那些不令人感兴趣的规则。此外,支持度还具有一种期
中可以提取如下规则:{尿布}一 {啤酒 }。该规则表 明 望的性质,可以用于关联规则的有效发现。
尿布和啤酒的销售之间存在着很强的联系,因为很多父 置信度度量通过规则进行推理的可靠性。对于给
亲在购买尿布的同时也购买啤酒。零售商们可以使用
您可能关注的文档
最近下载
- 《逆命题和逆定理》参考课件4.pptx VIP
- 2025年匹克球市场前景分析.docx
- SY 5490-2016 钻井液试验用土.pdf VIP
- 手术前焦虑恐惧的心理护理.pptx VIP
- 贵州铝业集团高校毕业生招聘笔试真题2025.docx VIP
- 2023年中国铝业集团有限公司华东区域法律中心法律顾问招聘考试真题及答案.docx VIP
- 2024中国铝业集团有限公司招聘1人笔试模拟试题及答案解析.docx VIP
- Q_SY 17348-2016 钻井液用页岩抑制剂聚合醇技术规范.pdf VIP
- 2024中国铝业集团有限公司招聘1人笔试备考试题及答案解析.docx VIP
- 2024中国铝业集团有限公司招聘1人笔试备考题库及答案解析.docx VIP
原创力文档

文档评论(0)