02-网络与新媒体的数据环境:大数据课件.pptxVIP

02-网络与新媒体的数据环境:大数据课件.pptx

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Chapter5第五节 网络与新媒体应用的数据环境——大数据1

2目前,信息海洋已经将我们团团围住,单一数据集容量超过几十TB甚至数PB已不罕见,其规模大到无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理,人类已经从小数据时代进入大数据时代。

一、大数据概述3所谓大数据是指那些大小已经超出传统意义上的尺度,已有的一般软件难以捕捉、存储、管理和分析的数据。一般意义上,大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。但不同的研究机构和学者对大数据的定义不尽相同。

4归纳起来,大数据的概念和内涵可以从广义和狭义两个方面进行诠释:广义的大数据概念,除了大数据技术及其应用之外,还包括大数据工程和大数据科学。狭义的大数据概念,主要是指大数据技术及其应用,是指从各种各样类型的数据中,快速获得有价值信息的能力。

5大数据的特点可以总结为4个“V”,即体量浩大(Volume)、模态繁多(Variety)、生成快速(Velocity)、价值巨大(Value)。

6大数据主要来自于:人们在互联网活动中,以及使用移动互联网过程中,所产生的各类数据,包括文字、图片视频等信息,各类计算机信息系统产生的数据,以及各类数字设备所采集的数据,如摄像头产生的数字信号、医疗物联网中产生的人的各项特征值、天文望远镜所产生的大量数据等。

二、大数据的关键技术7大数据的处理技术主要包括数据的采集、管理、分析与展示技术。具体来说,大数据的关键技术主要包括两个方面:非关系数据管理技术和云计算技术。一方面,关系数据库技术(RDBMS)经过了将近40年的发展,成为一门成熟的、同时仍在不断演进的主流数据管理和分析技术。

8但是,关系数据管理技术在大数据时代丧失了互联网搜索这个机会,其主要原因是关系数据管理系统(并行据库)的扩展性遇到了前所未有的障碍,不能胜任大数据分析的要求。在这种情况下,非关系数据管理技术应运而生。代表性的技术主要包括“映射归约”(MapReduce)技术、“海杜普”(Hadoop)技术、华为“SmartVision”技术和非关系型数据库(NoSQL)技术。

9另一方面,据统计,云计算与大数据的深度融合位列2013年大数据发展趋势的第三名,大数据能为云计算大规模和分布式的计算能力提供广阔的应用空间,云计算正在进入以“分析即服务(AaaS)”为主要标志的Cloud2.0时代。

10一是云计算基础设施可以作为有效平台来处理大数据分析应用的计算和数据存储需求。二是开发人员和研究人员可以采用软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)的架构模型来实现在云中的大数据分析解决方案。

三、大数据带来的主要挑战11总之,收集、保存、维护、管理、分析和共享正在呈指数级增长的数据是人类必须共同面临的挑战。具体来说,主要包括三个方面。首先,大数据中劣质数据带来的挑战。随着大数据的爆炸性增长,劣质数据也随之而来,导致数据质量低劣,能极大地降低数据的可用性。

12二是大数据对信息安全的挑战。大数据对信息安全的挑战主要包括两个方面。(1)如何防止数据被窃取或篡改。(2)如何防止个人信息泄漏。三是大数据的复杂性、不确定性和涌现性所带来的挑战。(1)复杂性造成网络大数据存储、分析、挖掘等多个环节的困难。(2)网络大数据的不确定性不确定性使得网络数据难以被建模和学习,从而难以有效利用其价值。(3)网络大数据的涌现性是网络数据有别于其它数据的关键特性。

13如何做到既深入挖掘数据给人类带来利益的智慧部分,又充分保护个人隐私不被滥用,找到信息开放和保护的平衡点,将是大数据时代面临的巨大挑战。我们需要科学认识大数据的价值,恰当分析大数据的分析结果,才能够有效防止陷入大数据分析的陷阱。在互联网时代,在大数据时代,任何数据资源,都将拥有了全然不同的价值内涵,在我们生活中,一切被记录的,都将会是有意义的。

四、发展现状14大数据在美国的研究和应用起步较早。2011年,Facebook首次公开新数据处理分析平台(PUMA),相比之前单纯采用“海杜普”(Hadoop)和“Hive”进行处理的技术,效率提高数万倍。近几年大数据的研究和应用在中国蓬勃发展。2012年6月9日,中国计算机学会常务理事会决定成立大数据专家委员会。

文档评论(0)

xiaomiwenku + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档