频繁模式及关联规则挖掘技术 .pptVIP

  • 11
  • 0
  • 约8.05千字
  • 约 43页
  • 2021-07-05 发布于湖北
  • 举报
第3课 频繁模式及关联规则挖掘技术 徐从富,副教授 浙江大学人工智能研究所 内容提纲 关联规则挖掘简介 关联规则基本模型 关联规则价值衡量与发展 参考文献 关联规则简介 关联规则反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么,其中一个事物就能够通过其他事物预测到。 典型的关联规则发现问题是对超市中的货篮数据(Market Basket)进行分析。通过发现顾客放入货篮中的不同商品之间的关系来分析顾客的购买习惯。 什么是关联规则挖掘 关联规则挖掘 首先被Agrawal, Imielinski and Swami在1993年的SIGMOD会议上提出 在事务、关系数据库中的项集和对象中发现频繁模式、关联规则、相关性或者因果结构 频繁模式: 数据库中频繁出现的项集 目的: 发现数据中的规律 超市数据中的什么产品会一起购买?— 啤酒和尿布 在买了一台PC之后下一步会购买? 哪种DNA对这种药物敏感? 我们如何自动对Web文档进行分类? 频繁模式挖掘的重要性 许多重要数据挖掘任务的基础 关联、相关性、因果性 序列模式、空间模式、时间模式、多维 关联分类、聚类分析 更加广泛的用处 购物篮分析、交叉销售、直销 点击流分析、DNA序列分析等等 关联规则基本模型 关联规则基本模型 Apriori算法 Fp-Tree算法 关联规则基本模型 I

文档评论(0)

1亿VIP精品文档

相关文档