大数据和未来生活.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.什么是大数据? 查了查百度百科,是这样定义的:大数据( bigdata ),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更 积极目的的资讯。大数据的 4V 特点: Volume 、 Velocity 、 Variety 、Veracity-- 这个好像是 IBM 的定义吧。 以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。 “大数据 ”在物理学 、生物学 、环境生态学 等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联 网和信息行业的发展而引起人们关注。 [2] 大数据作为 云计算 、物联网 之后 IT 行业又一大颠覆性的技术革命。  云计 算主要为数据资产提供了保管、访问的场所和渠道,而数据才是真正有价值的资产。企业内部的经营交易信息、 互联网世界中的商品物流信息,互联网世界中的人与人交互信息、位置信息等,其数量将远远超越现有企业  IT 架构和基础设施的承载能力,实时性要求也将大大超越现有的计算能力。如何盘活这些数据资产,使其为国家治 理、企业决策乃至个人生活服务,是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。 大数据到底有多大?一组名为 “互联网上一天 ”的数据告诉我们,一天之中,互联网产生的全部内容可以刻 满 1.68 亿张 DVD ;发出的邮件有 2940 亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达 200 万个(相当于《时代》杂志 770 年的文字量) ;卖出的手机为 37.8 万台,高于全球每天出生的婴儿数量 37.1 万 ?? 截止到 2012 年,数据量已经从 TB(1024GB=1TB )级别跃升到 PB( 1024TB=1PB )、EB( 1024PB=1EB ) 乃至 ZB (1024EB=1ZB) 级别。国际数据公司 ( IDC )的研究结果表明, 2008 年全球产生的数据量为 0.49ZB ,2009 年的数据量为 0.8ZB , 2010 年增长为 1.2ZB ,2011 年的数量更是高达 1.82ZB ,相当于全球每人产生 200GB 以 上的数据。而到 2012 年为止,人类生产的所有印刷材料的数据量是 200PB ,全人类历史上说过的所有话的数据 量大约是 5EB 。IBM 的研究称,整个人类文明所获得的全部数据中,有 90% 是过去两年内产生的。而到了 2020 年,全世界所产生的数据规模将达到今天的 44 倍。 [3] 每一天,全世界会上传超过 5 亿张图片,每分钟就有 20 小 时时长的视频被分享。然而,即使是人们每天创造的全部信息 —— 包括语音通话、电子邮件和信息在内的各种通 信,以及上传的全部图片、视频与音乐,其信息量也无法匹及每一天所创造出的关于人们自身的数字信息量。 数据量大( Volume ) 第一个特征是数据量大。大数据的起始计量单位至少是 P( 1000 个 T)、 E( 100 万个 T )或 Z (10 亿个 T)。 类型繁多( Variety ) 第二个特征是数据类型繁多。包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数 据的处理能力提出了更高的要求。 价值密度低( Value ) 第三个特征是数据价值密度相对较低。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值 密度较低,如何通过强大的机器算法更迅速地完成数据的价值 “提纯 ”,是大数据时代亟待解决的难题。 速度快时效高( Velocity ) 第四个特征是处理速度快,时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。 “大数据”并不能生产出新的物质产品,也不能创造出新的市场需求,但能够让生产力大幅提升。正如, 《大数 据时代:生活、工作与思维的大变革》作者肯尼思·库克耶和维克托·迈尔 -舍恩伯格指出:数据的方式出现了 3 个变化:第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混 杂性,而放弃对精确性的追求;第三,人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相互联系。 这一切代表着人类告别总是试图了解世界运转方式背后深层原因的态度,及利用这些信息来解决问题。  而走向仅仅需要弄清现象之间的联系以 某比萨店的电话铃响了,客服人员拿起电话。 客服: XXX 比萨店。您好,请问有什么需要我为您服务 ? 顾客:你好,我想要一份?? 客服:先生,烦请先把您的会员卡号告诉我。 顾客:** 。 客服:陈先生,您好!您是住在泉州路一号 12 楼 1205 室,您家电话是 2646**** ,您公司电话是 4666**** ,您 的手

文档评论(0)

zdq1013 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档