UCfor大数据解决方案.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
UCfor大数据解决方案

HDS 统一计算平台的大数据解决方案 HDS channel enablement Team Cicean Wang 议程 什么是大数据? HDS 和大数据 大数据 应用案例 大数据成功案例 什么是大数据? 它真正的含义是什么? 大数据及大数据时代 “数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产力增长和消费者盈余浪潮的到来”    ———麦肯锡 您将会面对的是…… 16.4 Exabytes In 2010 35 Zxabytes In 2020 IDC® 做出估算 30倍 这不是简单的数据增多的问题 而是全新的问题 大数据的定义(4V) 海量(Volume) 多样(Variety) 快速(Velocity) 价值(Value) 3亿用户,每天上亿条微博 中型城市每月数十亿智能电表数据 2015年全球移动终端产生的数据量6300PB 卫星图像 个人信息 M2M 日志文件 传感图像 视频 音频 非结构化数据将占到 75%-85% 增长速度快 用户基数庞大 设备数量众多 实时海量数据 数据指数级别增长 单条数据并无太多价值,但庞大的数据量蕴含巨大财富 存储 理解 控制 大数据最终的目的 大数据可以从根本上提高洞察力 获得洞察力! 跨越 鸿沟 $ 大数据分析处理的最终目标! 从复杂的数据集合中发现新的关联规则, 继而进行深度挖掘,得到有效用的新信息 大数据-第三次浪潮的华彩乐章 2012年3 月份美国奥巴马政府发布了《大数据研究和发展倡议》(Big Data Research and Development Initiative),投资2 亿以上美元,正式启动“大数据发展计划”。计划在科学研究、环境、生物医学等领域利用大数据技术进行突破。奥巴马政府的这一计划被视为美国政府继信息高速公路(Information Highway)计划之后在信息科学领域的又一重大举措。与 2013年12月 贯彻落实《广东省信息化发展规划纲要(2013-2020年)》,加快物联网、云计算、大数据等新一代信息技术创新应用,推进我省智慧城市建设,打造珠三角世界级智慧城市群,全面提升全省信息化发展水平。 广东省委副书记 朱小丹 广东省经济和信息化委员会副主任,党组副书记邹生 我们为什么需要大数据 在没有大数据技术之前,无论是机器,还是人工方式,无法获得全量样本。以人口普查为例,如果挨家挨户调研,甚至随机抽取做调研,都非常耗时,费力,很多国家甚至做不到每年发布一次 在没有大数据技术之前,大量海量数据中非结构化数据,分析与计算,几乎是一个不可能逾越的鸿沟,更别说挖掘价值了。 在没有大数据技术之前,分析数据仅作为参考目前现状的理论依据,也就是经验说话,数据无法实时展现价值。 在没有大数据技术之前,有原因所以有结果,维度由于分析能力有限,无法表现其真正意义,相关而非因果。 价值变革 经济变革 大数据应用案例 将大数据承诺转化为巨大的价值 10 从“谷歌流感趋势”工具看大数据应用 跟踪搜索词相关数据来判断全美地区的流感情况 这个工具工作的原理大致是这样的:设计人员置入了一些关键词(比如温度计、流感症状、肌肉疼痛、胸闷等),只要用户输入这些关键词,系统就会展开跟踪分析,创建地区流感图表和流感地图。谷歌多次把测试结果(蓝线)与美国疾病控制和预防中心的报告(黄线)做比对,从图可知,两者结论存在很大相关性。 以银行信贷审批决策为例 用户移动轨迹和精准用户群集分析应用 实时精准营销-只给最近的你 HDS统一计算平台 支撑大数据应用的IT架构实例 新的大数据技术 传统数据库处理方式 —池塘捕鱼 新的大数据处理方式 —大海捕鱼 待处理的数据 数据的自由度和性能矛盾。 固定字段、维度的表结构,限制了数据的入库和拓展。 数据处理 数据库 中间件 索引及应用开发 数据索引方式的瓶颈,依赖文件目录结构(NAS)或私有的位图块表结构(Block)。 非结构数据还需要上层数据库或文件系统提供索引; 面对大数据传统IT的架构的瓶颈 存储成本(TB) 20,000 rmb 数据库和中间件(TB) 15,000 rmb 计算(TB) 30,000 rmb 技术服务(TB) 10,000 rmb 应用服务 依赖合作伙伴 总体拥有成本(TB) 75,000 rmb 数据的膨胀带来更高的成本,但是已有的存储方式不支持线性扩展,还带来了数据管理性能的低下 面对大数据传统IT的架构带来的问题 新的大数据处理技术-Hadoop 核心思想

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档