关联规则与反向关联.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关联规则与反向关联

5.相关文献 strongly collective itemset model collective strength C(I) 度量兴趣(interestingness) v(I ) is the violation rate of I 用于正向关联 5.相关文献 strong negative association mining Savasere et al. 1998 1.正向关联借助相关背景知识 2.反向关联仅给出 ,不知道关联的具体形式 3.正向和反向关联的寻找分开进行 5.相关文献 Indirect associations Tan and Kumar 2002; Tan et al. 2000 5.相关文献 unexpected patterns Padmanabhan and Tuzhilin 1998, 2000 Exceptional patterns Hussain et al. 2000; Hwang et al. 1999; Liu et al. 1999; Suzuki 1997;Suzuki and Shimura 1996 treated as a special case of negative rules 鸟会飞 企鹅是鸟,不会飞 实验结果 1.正向和apriori比较 2.反向和遍历的比较 结论: 1. Effectiveness 一样好 2. Efficiency 省时间 1030 下午16点 文本挖掘 日本同志社 金明珏 * 3.1频繁项集基础上生成了一个大的集合Temk 3.2给Temk中的项集计数 * 关联规则 Efficient Mining of Both Positive and Negative Association Rules ACM Transactions on Information Systems, Vol. 22, No. 3, July 2004. XINDONG WU University of Vermont CHENGQI ZHANG University of Technology, Sydney, Australia SHICHAO ZHANG University of Technology, Sydney, Australia and Tsinghua University, China 提纲 1.概述 2.概念 3.搜索感兴趣的象集(interesting itemsets ) 4.搜索关联规则 5.相关文献 6.实验结果 1.概述 对apriori的改进 搜索项集: Interestingness Temk 搜索规则: conditional-probability increment ratio 1.概述 寻找事物之间的联系规律,发现它们之间的关联关系 分类:简单关联关系、序列关联关系 表示若A在事物中发生,B也很可能再事物中发生 超市:牛奶 面包 1.概述 反向关联( Negative Association) 形式: 预警:A 风险 B 风险 2.概念 项目(item) 项集(itemset) 事务(transaction) 前项( antecedent) 后项( consequent) 2.概念 规则支持度(Support):普遍性 项目X和项目Y项同时出现的概率 2.概念 符号上的差别 书上:事件角度 交 论文:集合角度 并,交为空 2.概念 频繁项集(frequent itemset) 支持度大于用户指定最小支持度 非频繁项集(infrequent itemset) 支持度小于用户指定最小支持度 数量非常大 2.概念 规则置信度(Confidence):准确度 A出现条件下B出现的可能性 3.搜索感兴趣的项集 Apriori算法 1.生成频繁项集 2.在此基础上生成关联规则 依据:support 、confidence Apriori算法:产生频繁项集 寻找频繁项集:自底向上,即从包含少量项目的项集开始依次向包含多个项目的项集搜索 基本原则:如果最底层中只包含D项的1-项集不是频繁项集,则包含D项的其他所有项集都不可能是频繁项集,后续无需再对这些项集进行判断 Apriori算法:产生关联规则 产生关联规则的步骤: 依频繁项集产生所有简单关联规则,选择大于最小置信度阈值的关联规则组成有效规则集合 对每个频繁项集L,计算L所有非空子集L’的置信度 若 大于最小置信度阈值,生成关联规则 3.搜索感兴趣的项

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档