- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据发展概况及行业解决方案分享
目录
1
理解大数据
2
大数据业界解决方案及典型应用概览
移动互联时代,数据爆发性增长
在60秒内,YouTube会上传48小时的视频;Google会收到2000000次搜索请求;Facebook的用户会分享684478条信息;
目前世界上90%以上的数据是最近3年才产生的;
2009年0.8Z,每年将增长50%,每两年便将翻一番,而预测全球的数据使用量到2020年会增长44倍,达到35.2ZB (1ZB = 10亿TB);
数字宇宙
大数据的主要来源
较少:传统IT,企业业务系统,门户网站;15%;
较多:社交网络兴起,大量的UGC(用户自生成内容)内容、音频、文本信息、视频、图片,非结构化数据出现了;
最多:物联网的数据量更大,加上移动互联网能更准确、更快地收集用户信息,比如环境、位置、生活信息等数据;
并处于急剧加速的趋势;
2
3
1
什么是大数据
Wiki百科:大数据(Big Data)是指那些超过传统技术处理能力的数据。它的数据规模和转输速度要求很高,或者其结构不适合原本技术存取、处理。
IDC:大数据,通常是指解决问题的一种方法,即通过收集、整理生活中方方面面的数据,并对其进行分析挖掘,进而从中获得有价值信息,最终衍化出一种新的商业模式。
实体角度
广泛意义
大数据的主要特征:4V
多样化
高速化
精确化
海量化
Volume:大数据体量巨大
每天25TB
日志数据
每天上传
168TB视频
每天9500万条
8
2011
2012
2015
全球数据存储量(ZB)
2.7
1.8
10
8
6
4
2
0
数量也许是与大数据最相关的特征;
从TB级别,跃升到PB、ZB级别;
前所未有的规模和加速趋势;
Variety:大数据的多样性
数据形式的多样
结构化数据,数据间有很强的因果关系;
半结构化数据,数据间因果关系较弱;
非结构化数据, 数据间无因果关系;
数据来源的多样性
不同的应用系统
各种设备
互联网
其它
Velocity:大数据处理速度要求越来越高
大数据与海量数据的一个重要区别,在于不仅数据尺寸大,而且对数据处理的响应速度有着更高的要求;
处理速度快,1秒定律;
传统的以周,天,小时为单位的运算处理周期,下降到以分钟,秒为单位;
大数据高价值的重要体现-处理速度;
信用卡欺诈检测:通过分析每个客户的历史用卡行为, 使用欺诈检测模型实时来检测每一笔交易是否异常。
案例
Veracity:精确化,大数据低价值密度的高精确要求
数据不确定性。例如人的感情,天气形势,经济因素,环境信息等。
价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
精确性是大数据最重要的特性,体现价值;
客观的数据体毫无意义;
精确是对大数据方法的要求和挑战,
第5V,大数据的价值
大数据的核心,第5V:Value;
eBay精准在线营销
Ebay 有 1.8 亿个活跃用户,有 3.5 亿左右的商品被销售,每天会产生 2.5 亿次搜索,拥有的原始数据是 10 PB;
用户行为模式+用户基本信息,更精准的定位客户,感知客户购物需求,促成在线交易率;
新浪微博+淘宝;QQ;
美国海啸预警
日本大地震发生后仅9分钟,美国国家海洋和大气管理局(NOAA)就发布了详细的海啸预警,制作的海啸影响模型出现在YouTube等网站;
NOAA的快速反应基于其全球范围内庞大的海洋传感器网络,获取全球范围的海洋信息,并对获得的实时数据进行计算机模拟。
NOAA的数据中心存储着超过20Pb的数据,是美国政府最大的数据库之一。
数据进行专业化处理,并与已知的现实相融合,洞察运营,促进和创新;数字石油;
数据回报率=数据价值/数据成本;
全球大数据市场规模从今年的148.7亿美元增长到2018年的463.4亿美元。
我们在信息的海洋里淹死了,却在知识的海洋里渴死了。
大数据带来的主要挑战和机遇
数据存储;
处理能力;
实时响应;
业务价值;
传统的IT架构和技术已经不能适应大数据的处理需求;
大数据的发展历程
早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据赞颂为“第三次浪潮”;
全球知名咨询公司麦肯锡最早提出“大数据”时代到来;
从2009年开始,“大数据”才成为互联网信息技术行业的流行词汇;
2012年出版的《大数据时代》,对大数据进行系统、明确的阐述;
2012年3月,美国政府投资2亿美元启动“大数据研究和发展计划”,美国政府认为大数据是“未来的新石油”,将“大数据研究”上升为国家意志。
我国尚未提出国家层面的大数据战略,在十二五的规划中把大数据作为物联网的相关关键技术提及;
EMC、惠普、IBM、微软在内的全球IT巨头纷纷布局大数据;今年最大的收购案都
您可能关注的文档
最近下载
- 海尔集团资本运营案例研究.pptx VIP
- 幼儿园课件:绘本《太阳想吃冰淇淋》.pptx
- 锅炉安全操作培训记录.docx VIP
- 流感样病例暴发疫情处置指南(2022版).docx VIP
- 李坚贞忠之士贞.pptx VIP
- SL 670-2015 水利水电建设工程验收技术鉴定导则.docx VIP
- 红光机器厂实训报告总结与反思.pptx VIP
- 人工智能技术在乳腺癌风险分层管理和治疗策略中的应用相关试题及答案.doc VIP
- MBN_LV_124-1_2013-03 12V车载电子系统电气要求和测试.pdf VIP
- SJT 11364-2014 电子电气产品有害物质限制使用标识要求.pdf VIP
原创力文档


文档评论(0)