数据挖掘与关联规则.pptVIP

  • 17
  • 0
  • 约4.89千字
  • 约 35页
  • 2016-11-28 发布于重庆
  • 举报
数据挖掘与关联规则

关联规则的价值衡量 客观上,使用“支持度和置信度”框架可能会产生一些不正确的规则。只凭支持度和置信度阈值未必总能找出符合实际的规则。 例:歌曲A、歌曲C为小众歌曲,歌曲B为口水歌,共有10万个用户,有200个人听过歌曲A,这200个人里面有60个听过口水歌B,有40个人听过歌曲C。听过歌曲C的人数是300,听过口水歌B的人为50000。 Confidence(A→B) = 0.3,Confidence(A→C) = 0.2 但是10W人里面有5W听过歌曲B,有一半的用户都喜欢歌曲B,但听过歌曲A的人里面只有30%的人喜欢歌曲 B 听过歌曲A的人不喜欢歌曲B 貌似A和B更相关 矛盾的规则,如何评价? 关联规则价值衡量 提升度 Lift(A?B)=Confidence(A?B)/Support(B)= 引入提升度Lift,以度量此规则是否可用。它描述的是:相对于不用规则,使用规则可以提高多少。 Lift(A→B) =Confidence(A?B)/Support(B)=0.3/0.5=0.6 Lift(A→C)= Confidence(A?C)/Support(C)=0.2/(300/100000)=66.7 歌曲A与B负相关,A与C正相关。 Lift大于1,表示使用这条规则进行推荐能提升用户听歌曲C的概率。 Lift小于1,则表示使用这条规则来进行推荐,还不如不推荐,让顾客自行选择好

文档评论(0)

1亿VIP精品文档

相关文档