大数据平台架构和建设思路.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据平台架构及建设思路 2019-6-30 中国移动通信集团设计院有限公司 三、中国移动大数据平台建设思路 二、主流技术比较 一、大数据介绍 目录 什么是大数据 “大数据”是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的数据集。目前,大数据的一般范围是从几个TB到数个PB。 ——麦肯锡 无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的大量而复杂的数据集合。 ——维基百科 数量大、获取速度快或形态多样的数据,难以用传统关系型数据分析方法进行有效分析,或者需要大规模的水平扩展才能高效处理。 ——美国国家标准技术研究院(NIST) 体量大、快速和多样化的信息资产,需用高效率和创新型的信息技术加以处理,以提高发现洞察、做出决策和优化流程的能力。 ——Gartner公司 运营商对大数据的理解 网络数据、用户数据、应用数据的汇聚构成了我们的“大数据”。这些结构化、非结构化的数据的处理和建模形成对用户、服务、资源、终端等对象的洞察。这些洞察与市场营销、网络运维等业务流程的衔接将会给公司带来新的价值。 大数据具备Volume 海量、 Variety 多样、 Velocity 快速、Value 价值的特点。据Ericsson预测,到2018年,每个手机终端每个月将产生2G的数据。(Ericsson Mobility Report,2013年) 传统商业智能 大数据1 大数据2 批处理,事先定义的查询和模型 非结构化的数据,包括互联网日志、web文本信息,非实时或准实时 流处理,实时的内容智能感知,策略执行,连续更新 价值 实时性 采集、建模和应用 数据处理实时性与价值呈正比 中国移动数据分布 B域 B域数据以客户关系、用户行为、产品信息等为主,支撑客户经营和产品营销等 O域 O域数据以设备数据、告警信息和性能信息等为主,支撑网络监控、网络优化、用户投诉处理等 M域 M域数据以财务、人力资源、供应链和办公信息等为主,支撑企业管理、企业办公信息化等 DPI数据域 DPI数据域以上网日志、内容构成、用户轨迹、网络信令等为主,可支撑流量经营、网络运维和增值服务等 业务平台 九大业务基地:基地数据以用户信息、用户行为信息等为主,可支撑个性化推荐、优化产品和服务等。WAP/短彩信:存储网络日志,可支撑定位网络及终端问题。 运营商大数据运用 对内: 客户上网数据处理、网页爬取和网页分类、分析挖掘客户上网行为 详单查询、上网日志查询 流量分析、客户视图、精准营销 网络运维优化 对外: 与航空公司合作,建立乘机客户识别模型,提供大数据挖掘、客户发展全流程大数据信息服务,提供针对性的营销方案 与交通运输部、省高速公路合作,开展“基于移动大数据分析在交通行业中的应用”研究项目 利用通信信令实时分析景区人流量,结合游客的行为数据挖掘,为旅游管理部门、景区提供数据的决策参考 以客户授权为依据,发挥移动客户实名数据优势,为互联网金融提供客户信息验真服务 与外部客户合作在手机冲浪平台实施移动广告精准投放 目前主要的电信运营商都已积极探索开发其内部大数据资源。但从目前的应用发展看,电信运营商的大数据仍主要用于内部服务的,如支持内部的客户流失分析、营销分析和网络优化分析等,对外的应用模式尚未成型,部分电信运营商开始尝试通过给第三方提供数据产品和服务,进行数据的增值。 三、中国移动大数据平台建设思路 二、主流技术比较 一、大数据介绍 目录 大数据具备数据量大、数据类型多、数据处理速度要求高和价值密度低的特点,传统分析系统架构(RDBMS +小型机+ 高端阵列模式)下,传统数据库无法支撑海量数据(如100TB以上,性能下降)、非结构化数据,现有IOE的架构无法线性扩展且成本高昂。 大数据处理技术 大数据对传统数据处理技术体系提出挑战 大数据处理技术 OldSQL :传统关系型数据库 NewSQL:新型MPP数据库,关系型数据库 NoSQL:泛指非关系型的数据库 Hadoop:对大量数据进行分布式存储和处理的软件框架 大数据三大技术比较 面对海量种类繁多的数据进行实时数据分析和离线数据分析,仅有传统的数据库技术已不适用,需要针对不同数据场景选择不同技术手段。 MPP数据库:适合结构化数据的深度分析、复杂查询以及多变的自助分析类应用、数据集市等。 Hadoop :适合海量数据存储查询(详单存储和查询)、批量数据ETL、非结构化数据分析(日志分析、文本分析)等。 传统数据库:在复杂关联、汇总、事务处理方面能力强,适合数据量小、高可靠、数据价值密度高的应用。 中国移动大数据目标架构 数据处理层(数据存储、数据计算、数据共享) 基础数据资源池(HADOOP) Map/Reduce2 HIVE Hbase HDFS 分析数据资源池(MPP) 分布式关系

文档评论(0)

东方888 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档