一种改进传统购物篮分析的关联规则挖掘研究.pdfVIP

一种改进传统购物篮分析的关联规则挖掘研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工神经两络与自然计算研究进展 一种改进传统购物篮分析的关联规则挖掘研究‘ 王德兴1胡学钢1刘晓平1j王浩1 l台肥工业大学计算机科学系230009 2中国科学院等离子体所 摘要基于改进传统购物篮分析的关联规则挖掘是在数据处理时引入兴趣度加权的思想,将所有交易 中的同一类商品交易量进行归一化处理,根据用户领域知识的要求。计算谊类商品的兴趣度加权闽值, 如依据基于利润法,基于资金周转法等,改进传统的购物篮分析,所挖掘的规剧符合实际,同时减少关 联规则挖掘的工作量,减少了大量冗余的规则,提高规则挖掘的效率和准确性.. . 关键词关联规则,ApdoH算法,数据挖掘 1.引言 挖掘的思想,并讨论了从大型超市的顾客交易中数据库中挖掘关联规则的问题。其定义在由一组称为事 务的布尔型记录组成的数据库上,每个记录包含了项目是否出现的信息,这种思想的一个典型应用是挖 掘基于超市交易数据的关联规则。其目标是挖掘经营超市如何获得利润最大的方案。关联规则也可应用 于消费者消费行为分析、商品的货架设计、库存控制和电子商务等。 传统基于购物篮p-41分析的数据处理方法在进行数据处理时.忽略顾客购买商品的具体数量,如将 大批量采购的客户与零售等同看待。众所周知,前者可能为超市的经营者带来丰厚的利润,而后者带来 的利润可能很小,因此如果忽略顾客购买商品的具体数量,在将超市交易数据转化为布尔型数据处理时, 所得到的规则是失真的、不准确的,甚至是歪曲的。 基于改进购物篮分析,挖掘超市数据中的关联规则需要在数据处理时引入兴趣度加权的思想,即把 所有的交易中的同一类商品进行归一化处理.然后以用户的某一标准,计算出该类商品的兴趣度加权阈 值,而不是根据用户主观随意的设定值,然后转换成布尔向量.这样使所挖掘的规则更符合实际。减少 了随意性。基于改进传统的购物篮分析,采用Apriori算法15,6]挖掘关联规则,计算其支持度和可信度, 从而提高了挖掘的效率和准确性。 2.关联规则的基本模型 基于购物篮分析的关联规则挖掘是针对在超市的交易数据库中进行的.其中一个事务就是一个顾客 的购物篮里一次购买商品的集合,每种商品就是一个布尔变量,表示该商品是否被购买,每一个篮子相 当于是一个事务,可用一个布尔向量表示,我们通过分析事务的布尔向量。得到反映顾客购买商品间的 set)。 频繁关联程度的关系,在这里可表现为关联规则,即令卢【fI,赴。,i3,稍是n个不同项目的集合(Item 设A是一个项目集,事务r包含彳当且仅当一DT。关联规则就是一个形如彳j口的逻辑蕴涵式,其中4口,, 分比是C,P(丑阻)是条件概率。同时满足支持度阈值和可信度阈值的规则称作强规则。为挖掘有效的关 。........,....二.』二...................。........一 +率课题受国际自然科学基金(编和安徽省教委基金(编资助. 第14届中国神经网络学术会议论文集 联规则(强规则),挖掘过程分两步进行:口挖掘D中的所有频繁项目集,要求其支持度大于支持度阈值。 口基于频繁项目集生成所有的关联规则,要求其可信度大于可信度阈值。 ’ 3.Apriori算法描述及特点 R.Agrawal等首先提出了关联规则挖掘的思想,并讨论了从大型超市的顾客交易数据库中挖掘关联 规则的问题。文献提出的Apriori算法是最有影响的挖掘布尔型频繁项目集的算法,奠定了布尔型关联规 则挖掘的基础,在有关关联规则挖掘的算法中,常见的关联规则挖掘算法大多是在该算法的基础上加以 改进的。 类推,直到不能找到频繁尽项目集为止。由于Apriori算法要求项目集的所有非空子集都必须是频繁的, 因而在数据库D中的事务中寻找频繁项目集时,需要进行连接和剪枝,才能挖掘强关联规则,因此关联 规则可以按如下方式产生:=对于每个频繁项目集工,产生£所有的非空子集。口对于£的每个非空子 集S,如果其可信度大于可信度阖值,则可产生关联规则“凸(£.S)”。该算法通过发现支持度大于用户 设定的支持度闽值的频繁项目集,再从频繁项目集中挖掘可信度大于用户设定的阈值

文档评论(0)

gubeiren_001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档