第三章关联规则挖掘4new.pptVIP

  • 41
  • 0
  • 约1.6万字
  • 约 82页
  • 2016-11-28 发布于重庆
  • 举报
第三章关联规则挖掘4new

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 3.5 关联规则、相关性、因果关系的区别 问题3:相关性是否意味着因果关系? 3.5 关联规则、相关性、因果关系的区别 城市中的医院数目 城市中的 罪案数目 城市人口数 混淆变量(Confounding?Variable):与自变量与因变量均有关,并导致两者产生虚假因果关系的变量 相关性不是因果关系的充分条件! 3.5 关联规则、相关性、因果关系的区别 健康工人效应(Healthy Worker Effect) 特种职业工人接触毒物 死亡率 选择偏倚:对接触毒物不适应者不符合招工条件,使接触毒物工人本来的健康水平较高,其对毒物的耐受性较强 相关性不是因果关系的必要条件! 高丽参与肺癌(混淆变量:年龄) 3.5 关联规则、相关性、因果关系的区别 相关性分析本身也不可靠 Simpson‘s Paradox:探究两种变量是否具有相关性时,在第三个变量分组比较中都占优势的一方,在总评中反而失势。 P大男生 P大女生 比例 T大男生 T大女生 比例 物院 45 8 5.6 101 51 2.0 外院 50 201 0.25 9 92 0.10 整体 95 209 0.45 110 143 0.77 英国统计学家E. H.Simpson1951年提出并解释 参

文档评论(0)

1亿VIP精品文档

相关文档