数据挖掘课程论文--关联分析.docxVIP

  • 43
  • 0
  • 约 5页
  • 2018-05-26 发布于贵州
  • 举报
数据挖掘课程论文--关联分析

学生超市购买商品的关联性分析 前言 “啤酒与尿布”是超市商品布局的一个经典案例,它是说在美国的沃尔玛超市中,将啤酒和尿布这两个看起来毫不相关的物品摆放在相邻的位置。其原因就是沃尔玛通过大量的数据分析,发现有非常多的年轻爸爸在购买尿布的时候会顺手购买一些啤酒,因此沃尔玛将这两样完全没有联系的商品放在了一起。这是关联分析在商业中一个非常成功的案例。 关联分析在超市中的应用,不仅仅局限在上述的沃尔玛的对超市商品布局的改善,特别针对于我校学生超市的特点,应用关联分析能够了解学生的购物特点及习惯,从而改善超市环境,提高收益。 我校学生超市的特点: 规模较小。通常情况下,位于学校的超市其规模通常较小,由于这个特点,使得学生超市的布局改善的空间非常小。 商品相对较为单一。作为学生超市,其服务对象基本都是学生,针对学生的特点,学生超市的商品通常以日用品为主,主要包括衣食住行中的食和住,此外有比较多的学习用品。 我校学生在学生超市消费的特点: 购物以食物、生活用品和学习用品为主。 购物时间比较集中。围绕着上课,学生在学生超市购物的时间主要集中在上午上课前、中午放学后、下午放学后以及晚自习后。 在超市停留时间较短。通常情况下,我校学生在超市购物停留时间较短,更多的都是有目的性的购物。 正因为以上学生超市和学生购物的特点,我们在做关联分析的时候将商品主要集中在了食物、日用品和学习用品上。数据来源于我校学生实验超市,采集了2012年9月21日——9月30日的数据。 数据整理 我们所得到的数据主要存在的问题包括重复记录、存在退货等,因此主要使用EXCEL对存在重复记录和退货的情况处理。删除重复记录,使得每一项小票(代表一个ID)说购买的某种商品的记录都是1次,从而避免数据重复对分析结果的干扰。而对于退货的商品,这去除该项记录。经过这两项的整理,最后共得到有效的商品消费记录为45006项。 关联分析 数据分析主要使用的是SAS中的Enterprise Mining模块。关联规则分析的模块如下图,过程主要包括变量分析、数据转换、关联分析、报告和解释等方面。 在关联分析的设置中,将支持度设置为20%,置信度设置为80%,同时最多只考虑四个商品之间的关联性,共得到记录2047项。结果如下表1:(根据支持度排序的结果,只取支持度大于0.1%),共得到52个记录,表一只列出了前20项。 表一 Relations Lift Support(%) Confidence(%) Transaction Count Rule 1 2 1.46 0.38 14.85 102 21 == 1 2 2 1.46 0.38 3.77 102 1 == 21 3 2 1.96 0.34 51.7 91 6923644223458 == 5 4 2 1.96 0.34 1.3 91 5 == 6923644223458 5 2 1.05 0.31 27.65 81 4 == 5 6 2 1.05 0.31 1.16 81 5 == 4 7 2 1.19 0.25 31.31 67 6907992101064 == 5 8 2 1.19 0.25 0.96 67 5 == 6907992101064 9 2 1.77 0.23 46.62 62 6907992100272 == 5 10 2 1.77 0.23 0.89 62 5 == 6907992100272 11 2 1.45 0.23 0.87 61 5 == 6937348110600 12 2 1.45 0.23 38.13 61 6937348110600 == 5 13 2 2.67 0.22 70.24 59 6923644264116 == 5 14 2 2.67 0.22 0.84 59 5 == 6923644264116 15 2 2.39 0.19 62.96 51 6923644241353 == 5 16 2 2.04 0.19 0.73 51 5 == 6900404519457 17 2 2.39 0.19 0.73 51 5 == 6923644241353 18 2 2.04 0.19 53.68 51 6900404519457 == 5 19 2 2.77 0.16 0.62 43 5 == 6907992505268 20 2 2.77 0.16 72.88 43 6907992505268 == 5 从表中来看,出现最多的(即支持度最大)的商品组合代码为21和1,它所代表的商品分别为奶茶(21)和沁园面包(1),共有102条记录,支持度为0.38%;其次为6923644223458和5,它所代表的商品组合为蒙牛纯牛奶(6923644223458)和奇乐贝尔面包(5),共有92条记录,支持

文档评论(0)

1亿VIP精品文档

相关文档