大数据的九个大教训.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1 PAGE 1 大数据的九个大教训 数据不能代替推断。数据,尤其大数据是可以帮助人类做出决策的工具,但不能起到代替的作用。RayHarishankar是这样说的:“数据加上分析是信息,信息加上语境可以供应洞察力,洞察力必定能导向正确的行动,正确的行动则带来提升价值的结果”。   昨天和今日我参与了俄亥俄州立大学的“大数据将来研讨会”。俄亥俄州正在与IBM公司合作在当地创建一个大数据中心,渐渐成为该领域的一个重要学术力气。本次研讨会汇聚了来自全国各地的专家和一名来自英国的专家,就该领域当前的成就、趋势和话题进行一次卓有成效的探讨。   大数据和开放数据不是一回事,但他们有着亲密的联系(正如我在主题发言稿“将来的大数据将会开放到什么程度?”上写到的)。我们正在关注的大数据一些趋势和话题与开放数据也有关系。根据这样的脉络,就出炉了这篇我在去哥伦布的路上学到的《了解大数据的九件事》。在研讨会的官网上可以看到我用黑体标注的人们的名字。   为大数据的激烈反应做好预备。许多演讲者提到了“大数据过分渲染宣传”的话题,认为大数据被争论得如此热情,以至于我们现在可以进入一个反应性的循环。MikeNelson对他在公开场合看到的渐渐出现的“垃圾数据”提出了责难,甚至建议我们应当重新命名大数据,它可以有一个“大兄弟”–就像许多人一样。他建议改名为:BFFMUDD,是大(Big)、肥(Fat)、快(Fast)、乱(Messy)、非结构化(Unstructured)、分布式数据(DistributedData)的缩写。   意识到“大数据的傲慢自大”。好几位演讲者引用了一份新报告,报告显示,“Google流感趋势”–大数据预估价值的首批大范例之一–被证明特别不精确。明显,Google可能自作聪慧地以一种错误的方式调整了其算法。不管什么样的错误,这都是个教训,表明假如不着眼于更宽阔的图景,而只是试图通过碾碎数据来发觉真相,通常状况下无法获得预期效果。   数据不能代替推断。数据,尤其大数据是可以帮助人类做出决策的工具,但不能起到代替的作用。RayHarishankar是这样说的:“数据加上分析是信息,信息加上语境可以供应洞察力,洞察力必定能导向正确的行动,正确的行动则带来提升价值的结果”。   相关关系不能强过理论。一些大数据的倡导者认为大数据几乎让理论变得多余:他们说,有了足够的数据,即使没有理论说明其原因,我们也可以发觉许多重要和有益的模式和趋势。的确,简洁的相关关系在一定程度上就可以驱动精确的预估。但即便是具备预估分析的能力,也并不意味着你就能真正地理解你正在研习的系统是如何运行的。EytanAdar建议我们端详大数据范围从预估性到解释性的全部相关努力,并且更多地关注如何理解我们所看到的东西,而不是仅仅关注可预估将来的模式。   大数据正在-冒着风险–追踪一个“移动”社会。在全球范围,移动设备都已经成为人类的首选在线连接工具。FarnamJahanian指出到2015年全球移动设备的数量将是人口数量的两倍,全部的设备都可以发送位置信息和其它数据给能够收集这些数据的公司。这将成为将来社会大数据的主要来源之一。但KateCrawford?指出了这里的隐私风险:由于人类移动行为模式的独特性,你可以仅用3-4个手机生成的数据点就能识别一个人。   大数据能帮助–或者损害城市的民主体制。正如HarveyMiller所说,通过手机数据、远程环境感应器、激光生成的航空地图和更多工具来追踪城市活动的能力,可以给我们创造拥有更高代谢功能的超级协调城市。(遗憾的是,我不得不在MichaelBatty关于城市分析的主题演讲之前离开,不过他在个人网站上供应了演讲内容)但是,KateCrawford在这里再次提出了警告。假如我们不小心,城市数据收集就会不对称地帮助富人而伤害穷人。比如,波士顿的StreetBumpAPP应用通过追踪智能手机的摇摆状态来收集坑洼里的数据,用志愿者的数据来反映一条道路的颠簸不平。但大多数智能手机的拥有者都属于生活富有的人群,以至于最初是在更富有的地区监测和修复坑洼–这是StreetBump目前正在致力于修正的难题。在相反的另一面,“预估监控”正在被用于将警察管制实施于预估将会有高犯罪率的地区,这将导致卑视性的执法。   隐私仍旧事关要紧。忘掉那些宣称公众,尤其是年轻人已经放弃隐私的报告吧。我们仍旧关心隐私问题,只是不知道该怎么做。这里有两个考虑因素:我们想知道政府机构或数据跟踪公司收集到了哪些关于我们的数据信息,以及假如我们不喜欢,则想让他们停止收集。关于如何解决这些考虑因素还不是很清楚。会上的一些发言者建议采用简洁的解决

文档评论(0)

认证主体菲亚企业管理咨询服务(天津自贸试验区)有限公司
IP属地天津
统一社会信用代码/组织机构代码
91120118MA05M78NXX

1亿VIP精品文档

相关文档