关联模式挖掘-侯全兵.pptVIP

  • 7
  • 0
  • 约2.79千字
  • 约 14页
  • 2018-04-06 发布于河北
  • 举报
关联模式挖掘-侯全兵

关联挖掘 (按姓氏拼音) 陈广新 阮艳琴 张莫 关联规则 一个被传诵了千百遍的例子: 沃尔玛超市号称拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其他门店的购买习惯,沃尔玛对其顾客购物行为进行购物篮分析,以期知道顾客经常一起购买的东西有哪些。在对统计出来的数据进行分析和挖掘后,一个意外的发现是:和尿布在一起购买的最多的竟然是啤酒。自习想想也不难理解,商家给出的解释是,美国太太经常叮嘱丈夫在下班后先去超市买尿布,而父亲们买尿布的同时顺手就给自己买了啤酒。这种关联超出了我们的正常思维模式,而正是得益于数据挖掘技术,我们才能发现这一潜在关联关系。 数据关联是数据库中存在一类的可被发现的重要知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可以分为简单、时序、因果关联。 关联分析的目的是找出数据库中隐藏的关系网。有时并不知道数据库中数据的关联函数,即是知道也是不确定的,因此关联分析生成的规则带有可信度。最终得到有趣的关联或相关联系。 关联规则挖掘的过程 第一阶段:先从资料集合中找出所有的高频项目组 关联规则挖掘的第一阶段必须从原始资料集合中,找出所有高频项目组(Large Itemsets)。高频的意思是指某一项目组出现

文档评论(0)

1亿VIP精品文档

相关文档