Page 1
大数据平台MPP与Hadoop架构分析
大数据平台MPP架构
MPP (Massively Parallel Processing),大规模并行处理系统,这样的系统是由许多松耦合的处理单元组成的,要注意的是这里指的是处理单元而不是处理器。每个单元内的 CPU都有自己私有的资源,如总线,内存,硬盘等。在每个单元内都有操作系统和管理数据库的实例复本。这种结构最大的特点在于不共享资源。
MPP架构数据库应具有的特征:
● 任务并行执行;
● 数据分布式存储(本地化);
● 分布式计算;
● 私有资源;
● 横向扩展;
● Shared Nothing架构。
大数据平台Hadoop架构
通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。
整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持,并通过MR来实现对分布式并行任务处理的程序支持。
HDFS采用主从(Master/Slave)结构模型,一个HDFS集群是由一个NameNode和若干个DataNode组成的(在最新的Hadoop2.2版本已经实现多个NameNode的配置-这也是一些大公司通过修改hadoop源代码实现的功能,在最新的版本中就已经实现了)。NameNode作为主服务器,管理文件系统命名空间和客户端对文件的访问操作。DataNode管理存储的数据。HDFS支持文件形式的数据。
从内部来看,文件被分成若干个数据块,这若干个数据块存放在一组DataNode上。NameNode执行文件系统的命名空间,如打开、关闭、重命名文件或目录等,也负责数据块到具体DataNode的映射。DataNode负责处理文件系统客户端的文件读写,并在NameNode的统一调度下进行数据库的创建、删除和复制工作。NameNode是所有HDFS元数据的管理者,用户数据永远不会经过NameNode。
架构对比分析
Hadoop
MPP
平台开放性
完全开放
闭源或部分开源
扩展能力
高
低
拥有成本
低
高
运维复杂度
低(熟悉Hadoop即可)
高(需掌握特定厂商的技术,容易被绑架)
系统和数据管理成本
高
中
应用开发维护成本
高
中
数据规模
PB级别
部分PB
计算性能
高
较高
数据结构
结构化、半结构化和非结构化
结构化数据
场景支持
多样化的工具支持复杂的数据场景如交互式sql分析(Impala),数据挖掘Spark,流式计算Spark Streaming,实时查询HBase,全文搜索Solr等
仅支持SQL
综合而言:
1、Hadoop?在处理非结构数据和半结构数据上具备优势,尤其适合海量数据批处理等应用需求。当然随着?Hadoop?技术的成熟,基于?Hadoop?的即席查询技术也逐渐崭露头角。比如仿照?Dremel?的开源项目Cloudera Impala已经有不弱于MPP的性能。?而且基于Hadoop架构的CDH平台提供了多样化的数据分析包括实时计算和历史计算,涉及数据查询、数据统计、数据分析(挖掘、学习)、文本检索等。且Hadoop天生具有低成本包括硬件成本,软件成本,开发成本,运维成本等的优势,对于超大数据集也能够很好的支持如PB或以上,CDH的扩展能力也是相当优秀,Cloudera在国外有数个上千节点的项目,在国内也有银联近300个节点的案例。
2、MPP?适合替代现有关系数据结构下(纯SQL)的大数据处理,具有较高的效率,但其在大规模集群(超过?100?个节点)下的可用性还有待证实。??
全文完
您可能关注的文档
- 信息系统物理安全技术要求1.docx
- 信息系统云华迁移服务流程设计方案1.docx
- 信息系统灾备体系总体技术方案1.docx
- 宿舍管理系统的设计与实现1.docx
- 大华数字硬盘录像机产品白皮书1.docx
- 大数据,人工智能方案汇编-能源电力行业篇V11.docx
- 大数据,人工智能方案汇编-企业服务行业篇V11.docx
- 大数据,人工智能方案汇编-医疗健康行业篇V11.docx
- 大数据ETL技术方案1.docx
- 大数据安全标准化白皮书1.docx
- 2025至2030酒店产业政府现状供需分析及市场深度研究发展前景及规划可行性分析报告.docx
- 2025-2030中国笔记本电脑和平板电脑行业市场现状供需分析及投资评估规划分析研究报告.docx
- 2025-2030中国安乃近行业运行形势及竞争策略分析研究报告.docx
- 2025至2030中国医用显示器行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030中国飞机加油行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030中国电机启动器行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030中国帮助创作工具(HAT)软件行业深度研究及发展前景投资评估分析.docx
- 2025至2030增益均衡器行业市场占有率及投资前景评估规划报告.docx
- 2025至2030红茶行业市场风险投资及运作模式与投融资报告.docx
- 2025至2030中国变频功率计行业调研及市场前景预测评估报告.docx
原创力文档

文档评论(0)