- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
【大数据时代】——数据分析在路上.pdf
大数据时代——数据分析在路上
大数据时代——数据分析在路上
大大数数据据时时代代————数数据据分分析析在在路路上上
[英] 维克托·迈尔-舍恩伯格(Viktor Mayer-Schonberger)
[英] 肯尼思库克耶(Kenneth) 著
2013-5-16 Leven
书评:
正如书的标题 A revolution that will transform how we live,work,and think 所说
一样,大数据时代已经到来,它正悄悄改变我们生存的环境,不断地从商业、学习、生活等
各个角度影响我们的行为方式,在这个快速且复杂变换的信息时代,我们需要一个更精准的
方法去决策人们的行动,大数据正在以划时代意义的让人们崛起,构造一种全新的思维模式,
做更好的决定。
接收新的理念,那就是从因果关系到相关关系的思维变革,建立在相关关系分析法基础上
的预测这是大数据的核心。可能我们暂时无法理解全体数据而不是样本数据的处理方法;不
能理解要效率而不是绝对精准的处理理念;更不能接受不追求因果这个决定性的关系而去寻
找相关关系的处理导向;《大数据时代》能告诉你为什么我们要有这样的转变,而这样的转
变能带来多少好处,IBM、谷歌、亚马逊、阿里等这些商业巨头已经开始做了很多成功大数
交流
交流
据处理案例,他们引领我们走向崭新的大数据世界,你还在等什么,数据分析在路上(交交流流
群:158328722
群:158328722
群群::115588332288772222),我们晃晃悠悠!
序
序
序序
� 大数据时代处理数据理念上的三大转变:
(1)要全体不要抽样
(2)要效率不要绝对精确
(3)要相关不要因果
� 努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,
就停下来。
引言 一场生活、工作与思维的大变革
引言 一场生活、工作与思维的大变革
引引言言 一一场场生生活活、、工工作作与与思思维维的的大大变变革革
� 大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础
上是无法完成的。
� 大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一
种机器学习。
� 大数据的核心代表着我们分析信息时的三个转变:
(1)在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关
的所有数据,而不是依赖于随机采样。
(2)研究数据如此之多,以至于我们不再热衷于追求精确度
(3)第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系
第一部分 大数据时代的思维变革
第一部分 大数据时代的思维变革
第第一一部部分分 大大数数据据时时代代的的思思维维变变革革
1. 更多——不是随机采样,而是全体数据
1. 更多——不是随机采样,而是全体数据
11.. 更更多多————不不是是随随机机采采样样,,而而是是全全体体数数据据
1.1 大数据与三个重大的思维转变有关,这个三个转变是相互关系和相互作用的:
(1)首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本
(2)其次,我们乐于接受数据的纷繁复杂,而不是追求精确性
(3)最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关
关系
1.2 随机采样不适合考察子类别的情况,因为一旦继续细分,随机采样结果的错误率会大大
增加。
1.3 全数据模式,样本=总体
1.4 多样性是有额外价值的
2. 更杂——不是精确性,而是混杂性
2. 更杂——不是精确性,而是混杂性
22.. 更更杂杂————不不是是精精确确性性,,而而是是混混杂杂性性
2.1 测量就是认知
2.2 错误并不是大数据固有的特性,而是一个需我们去处理的现实问题,并且有可能长期存
在。
2.3 要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是
您可能关注的文档
- _走出去_企业跨文化管理途径及策略研究_丛培信.pdf
- _酵母菌种群数量大小的动态变化_探究教学设计_朱秀丽.pdf
- _酶的特性及影响因素_探究模块设计.pdf
- _鉴赏诗歌的表现手法与表达技巧_专题突破_徐晓华.pdf
- _阿Q正传_中国民性改造的思想主题.pdf
- _阿Q正传_的叙事分析.pdf
- _隐含的归纳_优选论中的音系不透明现象_介绍.pdf
- _青少年心理健康素质调查表_应对分量表的编制.pdf
- _鱼中高温激活蛋白酶的提取纯化.pdf
- α细辛脑巴布剂的家兔相对生物利用度研究.pdf
- 2025年中国锻铁围栏市场调查研究报告.docx
- 2025年中国椭圆型市场调查研究报告.docx
- 2025年中国无蔗糖原味豆浆市场调查研究报告.docx
- 2025-2031年中国泛在电力物联网行业发展运行现状及投资潜力预测报告.docx
- 2025年中国制袋机零件市场调查研究报告.docx
- 2025年中国智能除垢型电子水处理仪市场调查研究报告.docx
- 2025-2031年中国甘肃省乡村旅游行业市场深度研究及投资策略研究报告.docx
- 2025-2031年中国干海产品行业市场发展监测及投资战略规划报告.docx
- 2025年中国全铝图解易拉盖市场调查研究报告.docx
- 2025年中国人造毛皮服装市场调查研究报告.docx
文档评论(0)