- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
超市商品购买关联分析
课程论文
题 目: 超市商品购买关联分析
学 院: 统计学院
专 业: 应用统计
班 级: 15 级统计硕
学 号:
学生姓名: 卞起鹏
指导教师: 徐雪琪
二○一 六 年 六 月
摘 要
购物篮分析是数据挖掘技术应用在零售业中的一种有效方式,其目的就是在
顾客的购买交易中分析出能够,同时购买一类产品或一组产品的可能性,利于商
品的摆放,也利于提高促销活动的效果。以一个面向小型超市的购物篮分析应用
实例为背景,利用Apriori算法找出满足最小支持度阈值和最小置信度阈值的强
关联规则,并运用此强关联规则给超市物品摆放提供建议性的意见。
关键词:数据挖掘;购物篮;关联规则;Apriori
1 绪论
1.1 研究的背景
超市通常以快速消费品的销售为主,具有和百货、电子商务等不同的特征,
比如消费者在购买决策和购买过程上就自身的特点。快速消费品大都是日常用
品,在采购时常出现即兴的情形,可能由于某些因素引发冲突购物。并且在购物
时,可能对周围其他人的建议不敏感,更多取决于个人偏好,同时商品的外观、
包装、广告、促销、价格、销售点等均对销售起着至关重要作用。
在国内的快速消费品市场,商品品种的差异性不大,价格竞争的空间也很小。
如何对商品进行合理布局,如何设计受欢迎的促销方案就成了超市竞争客户的一
个关键点,而布局、广告和促销的设计必须贴近消费者,这就要求超市分析消费
者购物的个人偏好,并且找到共性。
超市在运营中保存了交易明细账数据,我们考虑根据顾客购买商品的情况,
分析商品购买之间的关联,从而为超市提供合理的建议。具体的分析思路包含以
下两个方面:
(1)分析商品之间的潜在联系。顾客在选购商品时,经常会同时选购若干
商品,这些商品之间存在一定关联。
(2)分析顾客可能还会购买的商品。根据已经选购商品的情况,预测顾客
还可能选购的商品。
1.2 研究的意义
关联规则挖掘的一个典型例子是购物篮分析。市场分析员要从大量的数据中
发现顾客放入其购物篮中的不同商品之间的关系。如果顾客买牛奶,他也购买面
包的可能性有多大?什么商品组或集合顾客多半会在一次购物时同时购买?例
如,买牛奶的顾客有80%也同时买面包,或买铁锤的顾客中有70%的人同时也买
铁钉,这就是从购物篮数据中提取的关联规则。分析结果可以帮助经理设计不同
的商店布局。一种策略是:经常一块购买的商品可以放近一些,以便进一步刺激
这些商品的一起销售,例如,如果顾客购买计算机又倾向于同时购买财务软件,
那么将硬件摆放离软件陈列近一点,可能有助于增加两者的销售。另一种策略是:
将硬件和软件放在商店的两端,可能诱发购买这些商品的顾客一路挑选其他商
品。
2 关联规则理论综述
数据关联是数据库中存在的一类重要的可被发现的知识。若两个或是多个变
量的取值之间存在某种规律性,就称为关联。这种关联体现了事物及事物之间的
规律,掌握这些规律,可以对人们的行为进行有效地指导。因此,关联规则挖掘
成为了数据挖掘中的一项重要内容。
关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库
中隐藏的关联,并以规则的形式表达出来,这就是关联规则。有时并不知道数据
库中数据的关联函数,即使知道也不是确定的,因此关联分析生成的规则带有置
信度(可信度)。关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。
2.1 关联规则的分类
按照不同的情况,关联规则可以进行分类如下:
(1)基于规则中处理的变量的类别
关联规则处理的变量可以分为布尔型和数值型。布尔型关联规则处理的值都
是离散的、种类化的,它显示了这些变量之间的关系;而数值型关联规则可以和
多维关联或多层关联规则结合起来,对数值型字段进行处理,将其进行动态的分
割,或者直接对原始的数据进行处理,当然数值型关联规则中也可以包含种类变
量。例如:性别 “女” 职业 “秘书” ,是布尔型关联规则;性别 “女” avg
(收入) 2300,涉及的收入是数值类型,所以是一个数值型关联规则。
(2)基于规则中数据的抽象层次
基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。在单
层的关联规则中,所有的变量都没有考
文档评论(0)