- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络新技术之大数据39网络新技术之大数据39
网络新技术之大数据
5. 大数据技术
5.1 大数据的定义
5.2 大数据的技术特征
5.3 大数据的典型应用
5.4 大数据的发展趋势
一组数据
3亿用户,每天上亿条微博.
2015年全球移动终端产生的数据量6300PB
Facebook每天要存储大约100TB的用户数据;
NASA 美国宇航局
每天要处理约24TB的数据
微信国内用户4亿,国外用户突破7千万,每天产生数据
百度每天处理数据量100PB
GB
TB
PB
EB
ZB
大数据时代的爆炸增长
想驾驭这庞大的数据,我们必须了解大数据的特征。
地球上至今总共的数据量:
在2006 年,个人用户才刚刚迈进TB时代,全球一共新产生了约180EB的数据;
在2011 年,这个数字达到了1.8ZB。
而有市场研究机构预测:
到2020 年,整个世界的数据总量将会增长44 倍,达到35.2ZB(1ZB=10 亿TB)!
1PB (拍字节) = 2^50字节
1EB (艾字节) = 2^60字节
1ZB (泽字节) = 2^70字节
大数据概念和特征
什么是大数据(Big data)?
维基百科的定义:大数据指难以用常用的软件工具在可容忍时间内抓取、管理以及处理的数据集(一般单个数据集大小在10T左右)。
大数据之所以在最近走红,主要归结于互联网、移动设备、物联网和云 计算等快速崛起,全球数据量大大提升。
“大数据”是继云计算、物联网之后IT产业又一次颠覆性的技术变革
2006年左右,数据量已足够大,但是当时大数据不红,why?
为什么叫大数据:一是数量大
YB:2的80次方,ZB的1000倍
ZB:2的70次方,EB的1000倍
EB:2的60次方,PB的1000倍
PB:2的50次方,TB的1000倍
TB:2的40次方,GB的1000倍
GB:2的30次方,MB的1000倍
绝大部分应用在这两个数量级
二是类型多
结构特征:结构化、半结构化、非结构化
拥有特征:私有、共有、公开
形态特征:语音、文本、数值、图像、视频
为什么叫大数据:二是类型多
三是更接近把握信息资源的本质
大数据真正开始把信息变成资源
有的文章将大数据看作石油,大数据研究与自然资源利用发现、开采、提炼存在一定的相似之处
研究大数据,首先要研究各种有用的信息在何处,就是找矿
其次是把满足特定需求的信息收集过来,就是开矿
第三是把收集的信息按应用需求进行结构化处理,就是提炼,如同石油必须经过炼化才能变成消费用的汽油、柴油或作为原料用的聚乙烯、聚丙烯
第四是将这样的信息与具体的应用结合,使之发挥作用,这就是基于大数据的应用系统,或称之为围绕应用的大数据管理系统,如同汽油通过加油站加到消费者的汽车内,石化原料变成衣服、设备或其部件。
大数据的各部分组成
大数据技术:图像、音频、视频、非结构化、社交关系数据处理技术商;
现有IT系统改造商:大数据咨询公司、集成商、ERP、商务智能、客户关系管理系统;
终端提供商向数据提供商演进:对现有客户数据的深度把握、建立客户之间的社交和联系;
展现方式:大型控制中心、移动终端
在多样性、体量、速度三大特征的指引下,大数据将有新型的展现方式:大型控制中心和移动终端,实现数据的实时处理和快速决策。
大数据与传统数据库
11
大数据与其他新兴技术的关系
大数据、物联网、云计算、移动通信等都是近年涌现出来的新兴概念,彼此之间不是孤立的,而是存在着内部联系。
大数据带来的思维方式的变化
处理的对象往往是全部数据,而不是部分数据的采样
采样的不合理会导致预测结果的偏差,在大数据时代,依靠强大的数据处理能力,应该去处理全部的数据。
不再执迷于精确性
精确的、规范化的、可以被传统数据库处理的数据只占全部数据的5%,必须接受不精确性才能处理另外95%的数据。
错误的数据是客观存在的,竭力避免它就失去了应有的客观性和公平性。
大数据的简单算法比小数据的复杂算法更有效。
更加关注相关性,而不是因果性
预测依靠的是相关性。
很多情况下知道“是什么”即可,不必知道“为什么”。
大数据的价值链
数据
数据的掌控者,拥有或者可以收集大量数据的公司。海量的数据就是财富,可以考虑自己分析或者卖数据给其他公司。
技术
技术供应商或者分析公司。掌握了从海量数据中分析出有用信息的技能或者工具,但本身不一定拥有数据。
思维
有创新思维的人或者公司。他们对大数据敏感,有怎样挖掘数据的新价值的独特想法。
@2013 北京泽佳公司版权所有
Copyright?2013 Zejia Consulting Corporation
第 15 页
大数据基础架构要求
可预测的低延迟
高事务参数
灵活的数据结构
获取
组织
分析
决策
高吞吐量
就地准备
所有数据源和结构
深度分析
敏捷开发
高度可伸缩性
实时
流数据
运
您可能关注的文档
最近下载
- 2025年安徽皖江高速公路有限公司高速公路收费人员招聘笔试模拟试题及答案解析.docx VIP
- T GXTC 0014—2024 新式(现制)茶饮 茉莉花茶基底茶.pdf VIP
- 急性视网膜坏死综合征.pptx VIP
- 正常人体解剖学资料.pdf
- 《相遇问题》(说课稿)-2024-2025学年四年级上册数学青岛版[001].docx VIP
- 外伤性感染性眼内炎防治专家共识(2023年版)PPT.pptx VIP
- 第1节 功(教学课件)物理沪粤版2024九年级上册.pptx VIP
- 违规接受吃请检讨书(推荐).docx VIP
- 2024新人教版一年级数学上册认识立体图形第三单元教材整体分析.pdf VIP
- 密码技术应用员理论知识题及答案.doc VIP
文档评论(0)