基于Apriori算法的购物篮分析.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于Apriori算法的购物篮分析

基于Apriori算法的购物篮分析陈丽芳(重庆工商大学数学与统计学院,重庆400067)摘要: 从海量数据中快速准确地挖掘出有价值的能够描述数据项之间的相互关联关系,是数据挖掘研究的一个重要领域.就数据挖掘中的关联规则算法的概念及其在超市购物篮分析中的应用进行了探讨,对Clementine12.0的功能特点进行了介绍,并对廊坊师范学院的60位女大学生的购物信息进行了购物篮分析.关键词:关联规则;Apriori算法;Clementine;购物篮分析中图分类号:TP301.6文献标志码:A在当今商品充斥的时代,面对琳琅满目的商品与令人眼花缭乱的大量商家,消费者往往感觉无所适从.于是,商家开始通过对消费者购物行为的分析来对商品进行合理的摆放以及对商铺进行合理的布局,使商场提高销售业绩,创造更多的利润,也为消费者带来更多的方便.这也正是美国零售业巨头沃尔玛创造的“啤酒与尿布”的成功案例给人们带来的启示[2].每一次购物篮处理得到的都是一位顾客的购物信息,大多数零售企业只是将这些数据进行简单分类、分析单一的销量数据,实际上并没有充分利用这些能反映所有顾客购物行为最有效的数据,于是一些宝贵的数据资源就成了“数据坟墓”.关联规则一般用以发现交易数据库中不同商品之间的联系,用这些规则找出顾客的购买行为模式,比如购买了某一种商品对购买其他商品的影响,这种规则可以应用于超市商品贷架设计、货物摆放以及根据购买模式对用户进行分类等[3].通过发现这个关联的规则,可以更好地了解和掌握事物的发展、动向等.主要对廊坊师范学院女大学生在廊坊市沃尔玛超市的购物信息进行搜集及整理,并用 Clementine软件对其进行基于Apriori算法的超市购物篮分析.1关联规则理论关联规则是一种简单,实用的分析规则,它描述了一个事物中某些属性同时出现的规律和模式,是数据等人首先提出的,最经典的关联规则的挖掘算法是挖掘中最成熟的主要技术之一.它是由R.AgrawalApriori,该算法先挖出所有的频繁项集,然后,由频繁项集产生关联规则,许多关联规则频繁项集的挖掘算法都是由它演变而来的,关联规则在数据挖掘领域应用很广泛适合于在大型数据集中发现数据之间的有意义关系,原因之一是它不受只选择一个因变量的限制,关联规则在数据挖掘领域最典型的应用是购物篮分析.大多数关联规则挖掘算法能够无遗漏发现隐藏在所挖掘数据中的所有关联关系,所挖掘出的关联规则量往往非常巨大,但是,并不是所有通过关联得到的属性之间的关系都有实际应用价值,对这些关联规则进行有收稿日期:2013-10-30;修回日期:2013-11-14.作者简介:陈丽芳(1990-) ,女,河北邯郸人,硕士研究生,从事国民经济统计学研究.第5期陈丽芳:基于Apriori算法的购物篮分析85效的评价,筛选出用户真正感兴趣的,有意义的关联规则尤为重要[5].基于Clementine12.0的超市购物篮分析22.1Clementine12.0简介Clementine12.0是一个通用的数据挖掘软件,它能够帮助用户建立一个完整的数据挖掘流程,并提供一系列的功能使得用户可执行其中的任意挖掘步骤.这些功能包括:访问不同数据源中的数据、用不同的方式勘探数据、操作数据、建立各种数据挖掘模型、分析模型以及在企业环境中部署模型. Clementine 拥有丰富的数据挖掘算法,支持与数据库之间的数据和模型交换; 同时,具有可视化操作界面,简单易用,分析结果直观易懂,图形功能强大等特点,已从诸如 StatesoftStatistics、SASEnterpriseMiner、OracleDM、MATLAB、Angoss等众多数据挖掘软件中脱颖而出.它是ISL公司开发的数据挖掘工具平台.1999年SPSS 公司收购了ISL公司,对Clementine产品进行重新整合和开发,现在Clementine已经成为SPSS公司的又一亮点.作为一款将高级建模技术与易用性相结合的数据挖掘工具,Clementine 可帮助发现并预测数据中有趣且有价值的关系. 其最主要的特点是它能够把开发好的数据挖掘案例保存在它的知识库中以便日后重用. 对于商业管理人员,这个功能显著地提高了Clementine软件的可用性.2.2购物篮分析购物篮指的是超级市场内供顾客购物时使用的装商品的篮子,当顾客付款时这些购物篮内的商品被营业人员通过收款机一一登记结算并记录.所谓的购物篮分析(MarketBasketAnalysis)就是通过这些购物篮子所显示的信息来研究顾客的购买行为[2].主要的目的在于找出什么样的东西应该放在一起.藉由顾客的购买行为来了解是什么样的顾客,找出相关的联想(association)规则,企业藉由这些规则的挖掘获得利益与建立竞争优势.购物篮分析也就是销售小票数据分

文档评论(0)

ligennv1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档