- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大数据心得体会精选4篇
这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运
作的影响。
《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现
象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未
来进行预测,并对未来可能出现的问题提出自己看法与对策。
下面来重点介绍《大数据时代》这本书的主要内容。
《大数据时代》开篇就讲了Google通过人们在搜索引擎上搜索关键字留下的
数据提前成功的预测了20__年美国的H1N1的爆发地与传播方向以及可能的潜在
患者的事情。Google的预测比政府提前将近一个月,相比之下政府只能够在流
感爆发一两个周之后才可以弄到相关的数据。同时Google的预测与政府数据的
相关性高达97%,这也就意味着Google预测数据的置信区间为3%,这个数字远
远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果
的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克
托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总
体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前
采取的“样本;总体”的做法很大程度上无法做到更进一步的描述事物,因为之
前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式
来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大
降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主
流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。
接下来,维克多又通过了IBM追求高精确性的电脑翻译计划的失败与Google
只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什
么,只要有联系Google词库就会出现翻译,虽然有的时候的翻译很无厘头,但
是大多数时候还是正确的,所以Google的电脑翻译的计划的成功,表明大数据
时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基
础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底
第1页共10页
有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数
据也会无限的逼近事物的原貌。
之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这
是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到
任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不
想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免
个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一
部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得
与应用数据,是否侵犯了个人隐私。
无论如何,大数据时代将会到来,不管我们接受还是不接受!
我觉得《大数据时代》这本书写的很好,很值得一读。因为会给我们很多启发,
比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们
利用,从而再将相关数据卖给各大网店。不过,事实就是我们将会成为被预测被
引诱的对象。所以说,小心你在网上留下的痕迹。
我喜欢这本书是因为它给我展现了一个新的世界。
大数据心得体会篇2
信息和数据的定义。维基百科解释:信息,又称资讯,是一个高度概括抽象概
念,是一个发展中的动态范畴,是进行互相交换的内容和名称,信息的界定没有
统一的定义,但是信息具备客观、动态、传递、共享、经济等特性却是大家的共
识。数据:或称资料,指描述事物的符号记录,是可定义为意义的实体,它涉及
到事物的存在形式。它是关于事件之一组离散且客观的事实描述,是构成信息和
知识的原始材料。数据可分为模拟数据和数字数据两大类。数据指计算机加工的
“原料”,如图形、声音、文字、数、字符和符号等。从定义看来,数据是原始
的处女地,需要耕耘。信息则是已经处理过的可以传播的资讯。信息时代依赖于
数据的爆发,只是当数据爆发到无法驾驭的状态,大数据时代应运而生。这是否
是《大数据时代》一书所未曾阐述的背景材料?
在《大数据时代》一书中,大数据时代与小数据时代的区别:1、思维惯例。
大数据时代区别与转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。
文档评论(0)