全体数据取代随机样本.PPT

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
全体数据取代随机样本

《大数据时代》读后感 网络与新媒体印四川 2009年H1N1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。 目录 思维变革 商业变革 管理变革 管理变革 一、让数据主宰一切的风险 二、责任与自由并举的信息管理 我们时刻都暴露在“第三只眼”之下:天猫、淘宝、亚马逊监视着我们的购物习惯,百度、谷歌监视着我们的网页浏览习惯,而微博、APP等工具不仅知道我们的兴趣爱好,甚至还窃听到我们的社交关系网。 2006年8月,美国在线(AOL)公布大量的旧搜索查询数据,本意是希望研究人员能从中得到有趣的见解。在这庞大的数据库中,研究人员把同一个人的所有收索查询记录联系在一起来分析,而不包含任何个人信息。但《纽约时报》还是在几天之内通过把“60岁单身男性”、“有益健康的茶叶”、“利尔本的园丁”等收索记录综合分析后,发现了数据库中的4417749号代表的是佐治亚州利尔本的一个62岁的寡妇塞尔玛·阿诺德。 在大数据时代,不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了。 预测与惩罚,不是因为“所做”而是因为“将做”。 大数据独裁,加剧旧威胁:过分依赖数据。 从个人许可到让数据使用者承担责任 个人动机VS预测分析 反对数据垄断大亨 谢谢观赏 思维变革 一、全体数据取代随机样本 二、混杂性取代精确性 三、相关关系取代因果关系 商业变革 一、一切皆可“量化” 二、数据创新 三、数据、技术、思维的三足鼎立 如2008年初,阿里巴巴平台上整个买家的询盘数急剧下降,自然导致买盘的下降,说明欧美对中国的采购量在下滑。海关是卖出了货以后才获得数据,而阿里巴巴早在半年前就从询盘上推断出世界贸易的变化。 大数据时代,商业竞争不再是劳动生产率的竞争而是知识生产率的竞争。 乔布斯成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然最后难免死于癌症但这种获得所有数据而不是仅样本的方法将他的生命延长了几年。 大数据时代纷繁复杂,优劣参杂,分布在全球多个服务器上。拥有了大数据,我们就没必要再需要对一个现象刨根问底,只要掌握大体发展的方向即可。 海量数据 导致 精确度下降 如果数百万条电子医疗记录显示橙汁和阿斯匹林的特定组合可以治疗癌症,那么找出具体的药理机制就没有这种治疗方法本身来的重要。

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档