论大数据理论基本原理和其价值创造.docVIP

论大数据理论基本原理和其价值创造.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论大数据理论基本原理和其价值创造

论大数据理论的基本原理及其价值创造 华南师范大学 陈俊欢 1. 步入大数据时代 如今,我们已经进入了一个大数据的时代。Facebook在2012年平均每个月有300亿条内容被创建,每天处理的数据量多达500TB(1TB=1000GB)。并且至今Facebook已存1400亿张图片,今年将增700亿张。据YouTube公布数据显示,目前用户每分钟上传的视频长度为72小时。eBay的分析平台每天处理的数据量高达100PB(1PB=1000TB),超过了纳斯达克交易所每天的数据处理量。另外根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB(1ZB等于1万亿GB),而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍。 事实上大数据绝不仅仅是数据的总量增大了,大数据指的是以一种集合的形式来包含所有数据,其大小或复杂性使得无法通过常用技术以合理的成本,并在可接受的时限内对其进行捕获、管理和处理。 2. 大数据时代的成因 我们先来看看大数据时代形成的原因,并且从以下三个方面来进行解释。 2.1信息生产方式的改革 信息生产方式的变革可以从两个方面来说,一是随着电脑,手机,小型摄像机等信息生产设备的普及,每位拥有者都能很轻易地创建自己的信息;二是信息的生成方式越来越多样化,以前人们一般都是通过纸张来记录信息的,如今我们还可以用短信,语音,视频,照片,微博等丰富多样的方式把各种信息记录下来。 2.2信息传播方式的改革 传统的三种信息传播渠道(报纸,电视,广播),无论是在传播的及时性还是广度始终都受到一定的限制,然而随着互联网的出现,这种情况则完全改变了。互联网使得我们每个人都能通过网络来传播我们的信息,而且传播的速度非常快,并且能轻易到达世界上的每一个角落。 2.3信息记录方式的改革 如果按照美国国会图书馆的容量来保存信息的话,恐怕几百个美国国会图书馆也装不下一个Facebook公司的数据。但是随着信息存储技术的发展,我们不仅能够把如此庞大的数据给生产出来,而且还能把他很完整的保存起来。 因此,在这三者的影响下,我们进入大数据时代的条件已经被满足了。 信息生产方式变革 信息生产方式变革 (信息生产者增多,信息生产形式多样) 信息传播方式变革 (特别是互联网的出现) 信息存储方式变革 (主要依靠科学技术) 大数据时代 3. 大数据理论的本质依据 自从人类诞生之始,我们就不停地探索着世界的运行规律,随着我们探索的越多,我们所了解的也越多。“知道更多”可以说是我们人类存在的一个终极追求,千万年来我们无时无刻不做着这件事情。这时或许有人会反驳说,我们除了知道结果还应该知道过程,或者说是还应该知道他们之间的一种关系,这并没有错,但事实上我们要知道过程的原因也只是为了以后能更加便捷地知道更多的 结果。 毫无疑问,这个世界的运行总是遵循着某一规律的,即自然之规律。所谓规律,其实可以分为三种。一者是恒常规律,如日出日落,生老病死,绝无异常;二者是混沌规律,凡事不可捉摸,无法确定;三者即为浮动规律,有迹可循却又无法准确把握。 恒常规律浮动规律 恒常规律 浮动规律 混沌规律 实际当中,恒常规律和混沌规律都是极少出现的,那么则可以说无论是在我们的生活领域还是经济领域上最常会出现的一个规律就是浮动规律。事实上这一点几乎所有人都知道,也都隐含于每个人的意识之中。那么,这样的一条规律或者说这样的一种意识又会对我们造成了怎样的影响呢? 让我们先来看看我们现在主流的方法是如何来认知我们所在世界的规律的。通常我们会遇到某一个问题,比方说公司的市场份额下降了,然后我们马上会找出其内在的原因,收集数据样本作出分析,接着就会制订出一系列的指导方案,再去执行,最后再来印证实施的情况是否符合原假设,如果符合则代表我们的认知是正确的,反之如果不符合则又要从新构造模型,建立假设。 (探索)(得知) 运行规律 (探索) (得知) 运行规律 (印证) Why How What 诚然,在数据量小的时候,这种精确性的因果分析研究是唯一可行的方法,因为上文已经提到我们这个世界的运行规律本来就是浮动性的,如果分析过程再不要求精准,那么最终的结果更是相差甚远。然而事实上,这种基于有限样本的因果关系分析只是在数据量较小时的一种无奈之举。不仅操作过程非常麻烦,而且推测结果的有效性也往往难以得到保证。 然而,如果我们拥有了足够的海量的数据,情况就会变得完全

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档