- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关联规则技术在校实验超市应用探究
关联规则技术在校实验超市应用探究摘要:该文通过对所调研的广西电力职业技术学院中现有的四年多大学生实验超市的销售数据进行数据挖掘,从数据中挖掘出关联规则来指导超市的营销工作,使其能更现实地进行营销决策。
关键词:大学生实验超市;关联规则;数据预处理
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)16-4019-02
当今中国高职高专的教育都往企业市场化发展,即企业需要什么样的人才,我们就培养具备企业上岗能力的人才。在这样的职业化教育背景下,2007年,我所在学院建立了以“融、教、学、做”为一体的校内经营性实训基地——大学生实验超市。该超市完全模拟真实的超市来经营,且经营的主体全部是学生,服务的对象是校内的6000多师生。到现如今,四年的超市经营效益却不尽如意。由于大学生超市的数据库已有四年多的数据量,为了提高学生实验的效率,从这些海量的数据中挖掘出有用的信息从而辅助超市的营销理念,笔者运用数据挖掘的关联规则的知识,以大学生实验超市的数据为依托,挖掘出在校师生的购买规则,并针对在校师生的个人喜好及消费行为作出相应的商业促销及调整,从而提高大学生实验超市的盈利及利用率。
1关联规则的概念
Rakesh Agrawal等人于1993年首先提出了关联规则的数据挖掘概念[1],就是给定一个记录集合及集合内的项(Item),通过分析记录集合,推导出项间的相关性。其最一般的表现形式为:购买尿布的顾客中,有70%的顾客同时也会购买啤酒。关联规则就是从海量的数据挖掘出隐藏在数据间的相互关系,从而促进信息的显化[2]。关联规则可以用四个属性来描述:
1)可信度:在规则A出现的前提下,规则B出现的概率。
2)支持度:在规则A、B同时出现的概率。用S表示。
3)置信度:在数据库中存在C比例的交易记录满足“若包含A就包含B”条件,称规则A=B具有C置信度。
4)数据项的集合称为项集(Itemset),包含K个数据项的项集称为K-项集。如果一个项集在数据库D中的出现频率大于设定的最小支持度min-sup与交易数据库D记录总数的乘积,则该项集满足最小支持度阀值,称该项集为频繁K-项集[3]。
由于关联规则是通过频繁项集直接产生的,因此关联规则所涉及的所有项集均满足最小支持度阀值。
2关联规则在超市数据的应用分析
1)原始数据收集
为了说明关联规则的数据挖掘方法,结合实践过程,笔者随机抽取了本校学生近两年的购买情况表500份,并提取以下数据:姓名,性别,班级,宿舍号,购买清单,日期。因为数据比较离散化,所以数据进入挖掘前必须经过数据预处理。即将数据按照一定的规则影射到某个区间,填补空缺值,去除孤立点,纠正不一致,平滑噪声等操作,从而形成语法一致的数据[4]。如:由于超市面积较小,分片区管理,我们可根据片区对购买物品进行数据预处理,即分成几大类:食品类(固性),日用品类,学习用品类,饮料类(液体)。分别用1,2,3,4表示。部分预处理后的数据如表1所示。
2)挖掘关联规则
用于关联规则挖掘的主要对象是事务型数据库(Transactional databases),一个事务一般由如下部分组成:事务标识符,事务中包含的项目集。则采用关联规则的经典算法APriori算法,得到如下表2的关联规则结果。
表2关联规则结果表
3)规则的理解及应用
由表2我们可以挖掘出以下几个规律:
①同学们在购买食品类的同时,比较喜欢再购买饮料类的东西。且男同学表现比女同学更符合这个规律。
②班级相同的学生,购买物也比较相同。
因为我们下一步超市工作的重点是开通校园超市网购,从上述规律,我们可以指导我们的下一步网购营销工作。诸如在陈列货品的时候,可以把食品类的货物与饮料类的货物摆放相近位置。班级相同的学生宿舍相同或是相近,若有同学网购食品类,我们送货人员则可以顺带饮料类上门,促进饮料的销售。特别是对于男同学销售时。且一个宿舍的学生网上申请购买物品,需要我们送货上门时,根据规则②我们可多备几份送到宿舍,以扩大销售量。需要特别的指出来的是,学校教师在校超市购买的支持率相当低,说明教师们很少在校超市购买商品。再进一步调查,发现符合教师购买的商品也比较偏少。如何在教师中打开销路,也是超市以后要考虑的问题。
3结论
利用关联规则来促进超市营销是一种科学的决策方法,在一定程度上可以避免主观或经难决策中的一些盲点,同时也锻炼学生的分析实践能力。基于数据挖掘技术的决策系统将会在超市的数据分析中得到更加广泛的认可。但我们也看到我们的不足,如学生两年内就要到外校实习,同一学生的数据量不够;数据范围太广,如购买的货物上百种,我们只影射到4类货物太
文档评论(0)