大数据的发展背景和研究意义 .pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据的发展背景和研究意义

近几年来,随着计算机和信息技术的迅猛发展和普及应用,行

业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性

增长。动辄达到数百TB甚至数十至数百PB规模的行业/企业

大数据已远远超出了现有传统的计算技术和信息系统的处理能

力,因此,寻求有效的大数据处理技术、方法和手段已经成为

现实世界的迫切需求。百度目前的总数据量已超过1000PB,

每天需要处理的网页数据达到10PB~100PB;淘宝累计的交易

数据量高达100PB;Twitter每天发布超过2亿条消息,新浪微

博每天发帖量达到8000万条;中国移动一个省的电话通联记录

数据每月可达0.5PB~1PB;一个省会城市公安局道路车辆监控

数据三年可达200亿条、总量120TB。据世界权威IT信息咨

询分析公司IDC研究报告预测:全世界数据量未来将从的

0.8ZB增长到的35ZB(1ZB=1000EB=),将增长44倍,年均增长

40%。

早几年人们把大规模数据称为“海量数据”,但实际上,

大数据(BigData)这个概念早在就已被提出。,在Google成立

10周年之际,著名的《自然》杂志出版了一期专刊,专门讨

论未来的大数据处理相关的一系列技术问题和挑战,其中就提

出了“BigData”的概念。

随着大数据概念的普及,人们常常会问,多大的数据才叫

大数据其实,关于大数据,难以有一个非常定量的定义。维基

百科给出了一个定性的描述:大数据是指无法使用传统和常用

的软件技术和工具在一定时间内完成获取、管理和处理的数据

集。进一步,当今“大数据”一词的重点其实已经不仅在于数

据规模的定义,它更代表着信息技术发展进入了一个新的时

代,代表着爆炸性的数据信息给传统的计算技术和信息技术带

来的技术挑战和困难,代表着大数据处理所需的新的技术和方

法,也代表着大数据分析和应用所带来的新发明、新服务和新

的发展机遇。

由于大数据处理需求的迫切性和重要性,近年来大数据技

术已经在全球学术界、工业界和各国政府得到高度关注和重

视,全球掀起了一个可与20世纪代的信息高速公路相提并论

的研究热潮。美国和欧洲一些发达国家政府都从国家科技战略

层面提出了一系列的大数据技术研发计划,以推动政府机构、

重大行业、学术界和工业界对大数据技术的探索研究和应用。

早在12月,美国总统办公室下属的科学技术顾问委员会

(PCAST)和信息技术顾问委员会(PITAC)向奥巴马和国会提交了

一份《规划数字化未来》的战略报告,把大数据收集和使用的

工作提升到体现国家意志的战略高度。报告列举了5个贯穿各

个科技领域的共同挑战,而第一个最重大的挑战就是“数据”

问题。报告指出:“如何收集、保存、管理、分析、共享正在

呈指数增长的数据是我们必须面对的一个重要挑战”。报告建

议:“联邦政府的每一个机构和部门,都需要制定一个‘大数

据’的战略”。3月,美国总统奥巴马签署并发布了一个“大

数据研究发展创新计划”(BigDataRDInitiative),由美国国

家自然基金会(NSF)、卫生健康总署(NIH)、能源部(DOE)、国

防部(DOD)等6大部门联合,投资2亿美元启动大数据技术研

发,这是美国政府继宣布“信息高速公路”计划后的又一次重

大科技发展部署。美国白宫科技政策办公室还专门支持建立了

一个大数据技术论坛,鼓励企业和组织机构间的大数据技术交

流与合作。

7月,联合国在纽约发布了一本关于大数据政务的白皮书

《大数据促发展:挑战与机遇》,全球大数据的研究和发展进

入了前所未有的高潮。这本白皮书总结了各国政府如何利用大

数据响应社会需求,指导经济运行,更好地为人民服务,并建

议成员国建立“脉搏实验室”(PulseLabs),挖掘大数据的潜

在价值。

由于大数据技术的特点和重要性,目前国内外已经出现了

“数据科学”的概念,即数据处理技术将成为一个与计算科学

并列的新的科学领域。已故著名图灵奖获得者JimGray在的一

次演讲中提出,“数据密集型科学发现”(Data-

IntensiveScientificDiscovery)将成为科学研究的第四范

式,科学研究将从实验科学、理论科学、计算科学,发展到目

前兴起的数据科学。

为了紧跟全球大数据技术发展的浪潮,我国政府、学术界

和工业界对大数据也予以了高度的关注。央视著名“对话”节

目4月14日和21日邀请了《大数据

文档评论(0)

jy19959917256 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档