大数据与因果关系.PDFVIP

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据与因果关系

大数据与因果关系 赵森栋 2014年11月6 日 北京信工所 大数据时代:相关还是因果? 两派观点 一派观点: • 大数据代带来的思维:知其然而不知其所以然 • 因果不靠谱,相关性靠谱 大数据时代:相关还是因果? 两派观点 另一派观点: • 普林斯顿大学发表了一篇论文,称用谷歌搜索词来预测 Facebook将在2017年丧失80%的用户。随后Facebook的数 据科学家马上发表博文反驳,说谷歌搜索词并不能代表实 际趋势,相关关系并不等于因果关系 • 2014年哈佛大学的David Lazer在Science发文质疑2009年发 表在Nature上的用google搜索关键词预测美国流感的研究 工作,因为google在2013年7月份的预测结果超出了实际值 的2倍。只关注相关不关注因果会出严重的问题。 提纲 因果关系定义 因果分析的必要性和重要性 文本上的因果分析 统计变量间的因果分析 存在的问题 值得关注的研究问题 因果关系定义(1/7)  定义1 :如果某一现象或事件的发生或存在引起另一现象或事件的发 生或存在,这两个现象或事件间就具有因果关系。  休谟定义:如果两个对象在无限绵长的时间里总是先后出现,在空间 里总是接近。那么这两个对象间存在因果关系。  补充说明:  因果关系中的两个事件和现象有时间上的先后顺序。  如果不区分因果和相关,常常会把相关当成因果。  如果不区分原因和结果,常常会造成因果颠倒的谬误。西医的治疗手段 因果关系定义(5/7) 混淆因果和相关的例子 因果关系定义(6/7) 混淆因果和相关的例子 因果关系定义(7/7) 因果问题分析的层次 从每个人生成的含有因 常识因果 果逻辑的文本中直接抽 取或进一步推理 从观测的数据中使用统 浅层因果 计分析方法和因果推断 模型得到的因素之间的 因果作用 需要在结合多个浅层因 深层因果 果或者结合常识因果与 浅层因果的基础上进行 推理得到的因果 因果分析的必要性(1/2) • 因果与相关是两个不同的重要概念 • 无因果关系可能表现出虚假的相关性 – 张三和李四的手表上的时间 – 小学生的阅读能力与鞋的尺寸 – 每年溺水儿童和雪糕销量 –

文档评论(0)

yaner520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档