- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关联分析与决策支持.ppt-龙信思源.ppt
关联分析与决策支持;内容提要;1、关联规则基本概念;尿布 = 啤酒;
频繁模式:在数据集中频繁地出现的模式
频繁模式的应用
购物篮分析
交叉销售
分类设计
顾客购买习惯分析
频繁模式分析的重要性
揭示数据之间固有的联系
是许多数据挖掘任务的基础
如:联系、相关、因果关系分析等
;1、关联规则基本概念;关联规则挖掘用来发现存在于数据库中的属性集之间的潜在有用的有趣的关系。
假设I ={I1,I2 , …,Im}是项的集合,D是全部事务或记录的集合。事务集T是I上的一个子集,并用唯一的TID标示每个事务,设A和B是数据集D中的属性集,即A、B是I 的子集,关联规则:A?B的蕴含式,且A∩B =空集,A称为规则的条件或前件,B称为规则的结果或后件。
;1、关联规则基本概念;;数据挖掘主要就是对强关联规则的挖掘。
关联规则挖掘:给定一组Item和记录集和,挖掘出Item间的相关性,使其支持度和置信度分别大于或等于用户给定的最小支持度min_sup和最小置信度min_conf。
;Example:
设min_sup = 50%,
min_conf = 50%
频繁模式: {A:3, B:3, D:4, E:3, AD:3}
关联规则:
A ? D (60%, 100%)
D ? A (60%, 75%)
;相关概念
设I={I1,I2 , …,Im}是项的集合,称项的集合为项集(itemset)。包含k个项的项集称为k-项集。
例如:{milk}是1-项集,{milk, cake, pen}是3-项集。
项集的出现频率是事务集D中包含项集的事务数,简称为项集的支持度计数。
如果项集的支持度计数≥min_sup|D|,则称项集满足最小支持度。其中|D|为D中事务的总和。
如果项集满足最小支持度,则称它为频繁项集(frequent itemset)。频繁k-项集的集合记作Lk 。 ;根据规则中涉及的数据维数分类
单维关联规则vs. 多维关联规则
根据规则中处理的值类型分类
布尔关联规则vs. 量化关联规则
根据挖掘得到的规则集是否涉及不同的抽象层
单层关联规则和多层关联规则;*/31;4、Apriori算法介绍;TID;;L3与自身连接;5、建模示例-购物篮分析;5、建模示例-购物篮分析;5、建模示例-购物篮分析;5、建模示例-购物篮分析;5、建模示例-购物篮分析;将Web节点附加到“类型”节点,编辑Web节点,选择所有购物篮内容字段,选择仅显示true 标志,然后在Web节点???单击“运行”。;5、建模示例-购物篮分析;5、建模示例-购物篮分析;5、建模示例-购物篮分析;《数据挖掘概念与技术》
韩家炜,堪博 著
范明,孟小峰 译
2007-03-01
机械工业出版社
当当网卖价:¥41.20;谢谢!
文档评论(0)