2018商务智能原理与基础之关联规则教学案例.pptVIP

2018商务智能原理与基础之关联规则教学案例.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2018商务智能原理与基础之关联规则教学案例.ppt

商务智能原理与方法 —参考文档—;关联(association)规则是当前数据挖掘研究的主要方法之一,它反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物就能够通过其他事物预测到;如果我们把商场内的所有商品设置为一个集合,每个商品就是一个数据项(item)。商场的交易数据库通常包含每个顾客每一次购买的商品记录。关联规则表达的就是商品间联动购买的情况;关联规则的基本概念(1);关联规则的基本概念(2);关联规则的基本概念(3);案例:商场记录顾客购买商品的数据,假设有数据库D,数据集合I={MP3,羽毛球拍,旅游鞋,浴巾,跑步机};案例计算;案例总结;发现关联规则需要经历两个步骤,每一个步骤都对应规则生成过程中两大问题种的一个;关联规则 关联规则简介 关联规则挖掘方法 关联规则兴趣性 关联规则知识形式扩展 简单关联规则 小结及练习;支持度和置信度是评估关联规则的两个基本测度,进一步讨论关联规则在这两个测度上的性质对于关联规则的挖掘和应用很有意义(1);进一步讨论关联规则(2);进一步讨论关联规则(3);Apriori方法是基于上述思路的关联规则挖掘的经典方法,它是一种基于逐层搜索的迭代算法,从k项集生成满足规则的k+1项集。Apriori算法命名源于算法使用了频繁项集性质的先验(Prior)知识。 ;Apriori算法:变量说明(Ck:k-候选项集?;Lk:k-频繁项集;minsup:最小支持度阈值);实例(最小支持度50%);案例:某电子商城的购物记录,经理很希望知道什么样的顾客购买了什么样的手机,购买了某种手机是否还会购买另一种手机(设定α=40%,β=100%);客户手机频繁集;客户手机的关联规则;Apriori算法的不足;Apriori方法被认为是一个有效的经典的关联规则挖掘方法。对Apriori方法的进一步优化还可以从下列角度展开。;关联规则 关联规则简介 关联规则挖掘方法 关联规则兴趣性 关联规则知识形式扩展 简单关联规则 小结及练习;关联规则的应用越来越广泛,在很多行业都体现出了重要性。但是用户怎么知道从挖掘系统得到的结果就是他们想要的,就是对他们有价值的结果呢?怎样来评价一个规则是否有价值呢?主要从两个层面来评价;(1)系统客观层面:大多数算法都使用支持度-置信度的框架。这样的结构并不能保证产生的关联规则是完全正确的。规则的置信度有一定的欺骗性,它只表示了规则前件和后件的条件概率估计,并没有度量项目之间蕴涵的实际强度;案例分析计算;案例分析计算;案例分析计算;?;第3 个阈值---作用度(提升度、兴趣度):Lift,是置信度与期望可信度的比值。作用度描述项集A的出现对项集B的出现有多大的影响;作用度的计算及结果解释;用P(A)表示事务中出现项集A的概率, 以上四个参数可用如下公式表示;第4 个阈值——影响度:Influence ,关联规则X=Y影响度表示规则前项X和后项Y的的相关程度,influence影响度是将T检验的思想引入到关联规则中而成的;第4 个阈值——影响度:Influence;;(2)用户主观层面:系统客观层面只是挖掘潜在有趣的关联规则,真正有趣的关联规则要由用户来决定,只有用户可以决定规则的有效性、可行性,因此在挖掘数据时,引入约束;关联规则 关联规则简介 关联规则挖掘方法 关联规则兴趣性 关联规则知识形式扩展 简单关联规则 小结及练习;?;广义关联规则:包含高层数据间关系的关联规则成为广义关联规则。对于一些实际应用问题,人们发现在数据之间可能存在一定的关系,比如超市中的商品目录和类别划分所构成的反应超类和子类的隶属关系(层次关系);一个直接用Apriori方法挖掘广义关联规则的做法是转换数据。基本思路是将此次结构的所有高层数据(超类)也作为数据项放入数据库中。例题详解如下:;数码店销售记录;数码产品的层次结构;如果设定的最小支持度为30%,最小置信度为100%,则合格的关联规则有:;在广义关联规则的挖掘中,可以引入一些性质或兴趣性测度来进行剪枝和过滤低质量的规则;数量关联规则:在实际中,碰到的数据通常是类别数据或数值数据,如商品的数量、家庭的收入和客户的年龄等,这些数据属性分别成为多值属性和连续属性。基于多值和连续属性的关联规则称为数量关联规则;关联规则 关联规则简介 关联规则挖掘方法 关联规则兴趣性 关联规则知识形式扩展 简单关联规则 小结及练习;简单关联规则:即规则后项为单个数据项的关联规则;通过上页例子我们可得到如下两个性质:;是否只要在φ中发现存在形如X=YZ的规则就可以删除呢?是!;接下来要回答的问题是:能否只生成和保留简单关联规则?这样的简单关联规则的集合与全体合格关联规则的集合φ是什么关系?;例???:要求合格关联规则α=

您可能关注的文档

文档评论(0)

yuzongxu123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档