- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生活,工作以及思维的大变革
——读《大数据时代》有感及所思
读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎
么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一
些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的
思想被强烈震撼,不禁战栗起来。
本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些
变革涉及到我们生活的方方面面,几乎其影响程度可以与两次工业革命相媲美。
作者在第一部分提出了三个比较令人震惊的观点,也就是大数据的精髓在于我们
分析信息时的三个转变,这三个转变将改变我们的理解和组建社会的方法。并且
作者将生活,工作思维的大变革和这几个方面紧紧联系在一起。
第一个转变是,在大数据时代,我们可以分析更多的数据,有时候甚至可
以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。也就是说样本
等于总体;第二个转变是对研究数据不会追求精度,而且追求混杂性,小数据时
代下,追求精确度是合理的,因为我们收集的数据很少,所以要越精确越好,包
括如今仍然也在使用这种办法;但是在某些时代,尤其是在大数据时代背景下,
快速获得一个大概轮廓和发展脉络,要比精确性重要得多,既然选择了整体性,
肯定要忽视细节和确定性;第三个改变是不是因果关系而是相关关系,在大数据
时代,我们更需要了解一个东西是什么,而不是为什么,要找到关联无,通过一
个良好的关联物的相关关系可以帮助我们捕捉预测未来。
这三个方面是大数据时代所给我们带来的思维上的改变,所谓思路决定出
路,思路有了创新,有了拓展,相应的社会也就会有很大的变化。紧接着第二部
分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据
战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代
下的弊端以及在管理上的措施。个人认为本书的精髓部分是第一部分,第一部分
的三个观点涉及的面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第
一部分这三个观点为基础展开阐述的。
这本书给我感触最深的就是这三个转变,或者说是三个观点,可以说是哲
学上说的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,
就会导致各种变革的发生。首先是第一个,作者认为在抽样研究时期,由于研究
条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获
得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用
所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样
本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。这个观点足以
引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被
看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到
整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更
令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据
还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你
要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。
第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和
模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接
受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之
百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结
1
果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答
案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们
不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一
点,谷歌的翻译系统不像Candide那样精确地翻译每一句话,它谷歌翻译之所以
优于IBM的Candide系统并不是因为它拥有更好的算法机制,和微软的班科和布
里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。
而在阅读这本书时,发现这本书中争议最大的一个观点,不仅是读者,就
算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”
的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究
他们的因果关系。作者用林登的亚马逊推荐系统的成功,证实了大
原创力文档


文档评论(0)