数据仓库与数据挖掘基础第6章关联规则(赵志升).pptxVIP

数据仓库与数据挖掘基础第6章关联规则(赵志升).pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1、关联规则挖掘 2、挖掘事务数据库的单维布尔关联规则 3、挖掘事务数据库的多层关联规则 4、挖掘关系数据库和数据仓库的多维关联规则 5、由关联挖掘到相关分析; 关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。 从大量商务事务记录中发现有趣的关联关系,可以帮助许多商务决策的制定,如分类设计、交叉购物和贱卖分析。 关联规则挖掘的一个典型的例子是购物篮分析。;第一节 关联规则挖掘; 问题:什么商品组或集合顾客多半会在一次购物时同时购买? 回答:需要分析商店的顾客事务零售数据,并在其上运行购物篮分析。 分析的结果可以用于市场规划、广告策划、分类设计。例如,购物篮分析可以帮助经理设计不同的商店布局,以及规划什么商品降价。;1、购物篮分析 策略一:经常购买的商品可以放近一些,以便进一步刺激这些商品一起销售。 策略二:将经常购买的商品放在商店的两端,可能诱发买这些商品的顾客一路挑选其他商品。;1、购物篮分析 可以想象全域是商店中可利用的商品的集合,则每钟商品有一个布尔变量,表示该商品的有无。每个篮子可以用一个布尔向量表示。可以分析布尔向量,得到反映商品频繁关联或同时购买的购买模式。 这些模式可以用关联规则的形式表示:;1、购物篮分析 规则的支持度和置信度是两个规则兴趣度度量,反映规则的有用性和确定性,上述规则的支持度2%意味分析中的全部事务的2%同时购买计算机和操作系统软件。置信度60%意味购买计算机的顾客60%也购买操作系统软件。 关联规则被认为是有趣的,如果它满足最小支持度阈值和最小置信度阈值。这些阈值可由用户和领域专家设定。;2、基本概念 设I={i1,i2,…,im}是项的集合,。设任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合,使得T?I。每一个事务有一个标识符TID。设A是一个项集,事务T包含A,当且仅当A?T。关联规则是形如A?B的蕴涵式,其中A?I, B?I,且A?B=?。;2、基本概念 项的集合称为项集,包含K个项的项集称为K-项集。集合{computer,software}是一个2-项集。项集的出现频率是包含项集的事务数简称为频???、支持计数或计数。 项集满足最小支持度,若项集的出现频率大于或等于最小支持度与D中事务总数的乘积。 如果项集满足最小支持度,则称它为频繁项集。;2、基本概念 关联规则的挖掘包含两个基本步骤: 找出所有频繁项集:这些项集出现的频繁性至少和预定义的最小支持计数一样。 由频繁项集产生强关联规则:这些规则必须满足最小支持度和最小置信度。 挖掘关联规则的总体性能由第一步决定。;3、关联规则挖掘的分类标准 购物篮分析只是关联规则挖掘的一种形式。 根据下列标准,关联规则有多种分类方法: 根据规则中所处理的值的类型:若规则考虑项的在与不在,则它是布尔关联规则;若规则描述的是量化的项或属性之间的关联,则它是量化关联规则。如,下列为一个量化关联规则:;3、关联规则挖掘的分类标准 根据规则中涉及的数据维:若关联规则中的项或属性每个只涉及一个维,则它是单维关联规则;若关联规则涉及两个或多个维,则它是多维关联规则。如;3、关联规则挖掘的分类标准 根据规则集所涉及的抽象层:有些挖掘关联规则的方法可以在不同的抽象层发现规则。如,;3、关联规则挖掘的分类标准 根据关联规则的各种扩充:关联规则可以扩充到相关分析,以识别项是否相关。用最大模式(最大的频繁模式)或频繁闭项集显著压缩挖掘所产生的频繁项集数。;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第二节 挖掘事务数据库的单维布尔关联规则;第三节 挖掘事务数据库的多层关联规则;第三节 挖掘事务数据库的多层关联规则;第三节 挖掘事务数据库的多层关联规则;第三节 挖掘事务数据库的多层关联规则;第三节 挖掘事务数据库的多层关联规则;第三节 挖掘事务数据库的多层关联规则;第三节 挖掘事务数据库的多层关联规则;第三节 挖掘事务数据库的多层关联规则;第三节 挖掘事务数据库的多层关联规则;第三

文档评论(0)

职教魏老师 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档