- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1 第四章 数据挖掘中的主要方法--关联规则 关联规则简介 关联规则挖掘算法 Microsoft 关联规则挖掘模型简介 Microsoft 关联规则挖掘模型的使用 小结 2 关联规则简介 关联规则挖掘: 从大量的数据中挖掘出有价值的描述数据项之间相互联系 的有关知识。 应用: 购物篮数据分析,交差营销,价目表设置,聚类分类等等 3 购物篮分析: 一个引发关联规则挖掘的例子 如果我们想象全域是商店中可利用的商品的集合,则每种商品有一个布尔变量,表示该商品的有无。每个篮子则可用一个布尔向量表示。可以分析布尔向量,得到反映商品频繁关联或同时购买 的购买模式。这些模式可以用关联规则的形式表示。 例如,购买计算机也趋向于同时购买财务管理软件可以用以下关联规则表示: Computer- > financial_management_software [support=2%,confidence=60%] 关联规则是意义的,如果它满足最小支持度阈值和最小置信度阈值。 4 关联规则简介 设I={i1,i2,...,im}是数据项的集合。设D为与任务相关的数据集合, 也就是一个交易数据库,其中每个交易T是一个数据项子集合,即 T I;每一个交易有一个标识符,称作TID。设A是一个数据项集,交易T包含A当且仅当A T。 关联规则是形如A->B形式的蕴含式,其中A I,B I,并且A∩B= 。 5 关联规则简介 关联规则是形如A->B形式的蕴含式,其中A I,B I,并且A∩B= 。 规则A->B在交易数据集D中成立,具有支持度s和置信度c ,其中s是D中交易包含A∪B(即,A和B二者)的百分比,它是概率P(A∪B);D中包含A的交易同时也包含B的百分比是c ,这是条件概率P(B|A)。即 同时满足最小支持度阈值(min_sup)和最小置信度阈值(min_conf)的规则称作强规则。为方便计,我们用0%和100%之间的值,而不是用0到1之间的值表示支持度和置信度。 6 关联规则简介 一个数据项的集合称为项集。包含k个项的项集称为k-项集。 集合{computer,financial_management_software}是一个2-项集。 项集的出现频率是包含项集的交易数,简称为项集的支持度。 项集满足最小支持度阈值,如果项集的出现频率大于或等于最小支持度阈值(min_sup)与D中交易总数的乘积。 满足最小支持度阈值的所对应的交易记录数称为最小支持频度。 满足最小支持度阈值的项集就称为频繁大项目集。 频繁k-项集的集合通常记作Lk。 7 关联规则简介 “如何由大型数据库挖掘关联规则?” 关联规则的挖掘是一个两步的过程: 1.找出所有频繁项集:根据定义,这些项集出现的频繁性至少和预定义的最小支持计数一样。 2.由频繁项集产生强关联规则:根据定义,这些规则必须满足最小支持度和最小置信度。 如果愿意,也可以使用附加的兴趣度度量。这两步中,第二步最容易。挖掘关联规则的总体性能由第一步决定。 8 关联规则挖掘路线 市场购物分析只是关联规则挖掘的一种形式。事实上,有许多种关联规则。 根据下面的标准,关联规则有多种分类方法: (1)根据关联规则所处理的具体值进行分类划分 (2)根据规则中数据的维数进行分类划分 (3)根据规则描述内容所涉及的抽象层次进行分类划分 (4)根据关联规则所涉及的关联特性进行分类划分 9 关联规则挖掘路线 (1)根据关联规则所处理的具体值进行分类划分 如果规则考虑的关联是数据项的在与不在,则这种关联规则是一个布尔关联规则。 Computer- > financial_management_software [support=2%,confidence=60%] 如果规则描述的是定量数据项或属性之间的关联,则它是一个定量关联规则。在这种规则中,数据项或属性的定量数值可以划分为区间范围。 age(X,30...34) ∩income(X,42K...48K) - > buys(X,“computer“) 10 关联规则挖掘路线 (2)根据规则中数据的维数进行分类划分 如果关联规则中的项或属性每个只涉及一个维,则它是单维关联规则。 buys(X,computer) - >buys(X,financial_management_software) 如果一个规则涉及两个或多个维,则它是多维关联规则。 age(X,30...34) ∩income(X,42K...48K) - > buys(X,“computer“) 11 关联规
您可能关注的文档
- 地产项目复盘报告模板.ppt
- 地下水环评污染调查与评价方法.ppt
- 第1章热分析法.ppt
- 第2章-能级、能带.ppt
- 第3章消费税法习题.ppt
- 第4章-信道容量.ppt
- 第4章-由二维模型创建三维模型.ppt
- 第5讲-基于统计决策的分类方法.ppt
- 第5章+自底向上的语法分析.ppt
- 第6讲-门限回归模型.pptx
- WanKu万酷固定式二维影像扫描器VF5128用户手册.pdf
- Sunpn讯鹏 工位智能终端 SP-GWZD70X 用户手册.pdf
- Y系列桨板推进器用户手册.pdf
- 万酷电子扫描器一维红光扫设置手册.pdf
- Q-NAS QNAP NAS 说明书 TS-428-CN 20170105 快速安装指南.pdf
- 锐普威PCB雕刻机MODEL-D3说明书.pdf
- Run with your heart 毅力十二愛心跑 2025 跑手指南 用户手册.pdf
- Philips飞利浦图像引导治疗系统Azurion 7用户手册.pdf
- BEST-P建筑操作手册C_030_BEST-P操作手册.pdf
- SILO SILO电子贩卖机 Vending Machine Controller SIID 4 Button - Vending World User Manual说明书用户手册.pdf
最近下载
- DB37_T 4399—2021_养老机构临终关怀服务规范.pdf VIP
- (高清版)B-T 2408-2021 塑料 燃烧性能的测定 水平法和垂直法.pdf VIP
- 中国移动通信企业标准-M2M卡物联卡物联网卡移动物联网卡.PDF
- 模具管理规定(范本01).docx VIP
- (新版)导游资格证考试题库附参考答案(典型题).docx VIP
- 皮肤性病学(山东大)中国大学MOOC慕课 章节测验 客观题答案.docx VIP
- GC级压力管道监控运行工作方案.docx VIP
- 土建单项工程交安验收表.xls VIP
- 征信报告模板-带水印版.docx VIP
- 《平行四边形的判定(第一课时)》教案.docx VIP
原创力文档


文档评论(0)