- 5
- 0
- 约4.68千字
- 约 7页
- 2016-11-26 发布于重庆
- 举报
Hadoop1x與Hadoop2的区别
HYPERLINK /fenglibing/article/detailsHadoop入门进阶步步高(六)-Hadoop1.x与Hadoop2的区别
分类:? HYPERLINK /fenglibing/article/category/1826379 大数据?|2014-06-21 12:35 |294人阅读
六、Hadoop1.x与Hadoop2的区别
1、变更介绍
Hadoop2相比较于Hadoop1.x来说,HDFS的架构与MapReduce的都有较大的变化,且速度上和可用性上都有了很大的提高,Hadoop2中有两个重要的变更:
l?HDFS的NameNodes可以以集群的方式布署,增强了NameNodes的水平扩展能力和可用性;
l?MapReduce将JobTracker中的资源管理及任务生命周期管理(包括定时触发及监控),拆分成两个独立的组件,并更名为YARN(Yet?Another?Resource?Negotiator)。
1.1、HDFS的变化?-?增强了NameNode的水平扩展及可用性
1.1.1、Hadoop的1.X架构的介绍
而在1.x中的NameNodes只可能有一个,虽然可以通过SecondaryNameNode与NameNode进行数据同步备份,但是总会存在一定的时延,如果NameNode挂掉,但是如果有部份数据还没有同步到SecondaryNameNode上,还是可能会存在着数据丢失的问题。
架构如下:
包含两层:
Namespace
l?包含目录、文件以及块的信息
l?支持对Namespace相关文件系统的操作,如增加、删除、修改以及文件和目录的展示
Block?Storage?Service包含两部份
l?块管理(在Namenode中实现的)
提供数据节点群集成员的登记,并定期通过心跳进行检查。
提供块报告以及块的存储位置的维护
提供对块的操作,如对块进行增删改的操作及获取块的存储地址
对块的复本的的复制以及存储位置的管理
l?存储?-?提供Datanode进行数据的本地存储,并提供读写的操作
1.1.1、Hadoop的2.X架构的介绍
在2.X中,HDFS的变化,主要体现在增强了NameNode的水平扩展及可用性,可以同时部署多个NameNode,这些NameNodes之间是相互独立,也就是说他们不需要相互协调,DataNode同时在所有NameNodes注册,做为他们共有的存储节点,并向定时向所有的这些NameNodes发送心跳块使用情况的报告,并处理所有NameNodes向其发送的指令。
架构如下:
?
存储块池(Block?Pool)
一个存储块池是由一组存储块组成,它属于一个单独的Namespace(Namenode),集群中所有存储块池的存储块都是存放在Datanodes中的。每个存储块池与其它的存储块池都是独立管理的,因而其在为新的块生成Block?IDs时,就不需要与其它Namespace(Namenode)中的存储块池进行协作,即使一个Namespace(Namenode)挂掉了,也不会使得Datanodes中的块被访问不到,因为其它Namespace(Namenode)中的存储块池也存放了Datanodes中所有存储块的信息。
一个命名空间(Namespace)和它的块池一起被称为命名空间向量。它是一个自包含的管理单元。当一个Namenode/namespace被删除,存储于Datanodes中的相应的存储块池也会被删除掉,在集群的更新过程中,每个命名空间向量都是以一个整体进行升级的。
?
集群ID(ClusterID)
集群ID的加入,是用于确认集群中所有的节点,也可以在格式化其它Namenodes时指定集群ID,并使其加入到某个集群中。
?
1.2、MapReduce拆分JobTracker为资源管理及任务生命周期管理两个独立的组件
MapReduce在Hadoop2中称为MR2或YARN,将JobTracker中的资源管理及任务生命周期管理(包括定时触发及监控),拆分成两个独立的服务,用于管理全部资源的ResourceManager以及管理每个应用的ApplicationMaster,ResourceManager用于管理向应用程序分配计算资源,每个ApplicationMaster用于管理应用程序、调度以及协调。一个应用程序可以是经典的MapReduce架构中的一个单独的任务,也可以是这些任务的一个DAG(有向无环图)任务。ResourceManager及每台机上的NodeManager服务,用于管理那台机的用户进程,形成计算架构。每个应用程序的ApplicationMaster实际上是一个框架具体库,并负责从ResourceManage
您可能关注的文档
- GPS靜态测量在物探控制测量中的应用.doc
- GP技術的展望.doc
- Gridview,Repeater,datalist等數据绑定控件的区别.docx
- GRNN網络在企业盈利能力预测中的应用.doc
- GPS測量的设计与实施.doc
- GPT分區表下安装win7的方法.docx
- Grubbs法在室內质控中的应用和问题.doc
- Gram方陣的探讨.doc
- GrWMn材料提高表面質量的方法.doc
- GS388淺论中小外贸企业融资难的问题及对策.doc
- 广东省广州省实验中学教育集团2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州大学附属中学2025-2026学年八年级上学期奥班期中物理试题(解析版).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(含答案).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(解析版).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 2026《中国人寿上海分公司营销员培训体系优化研究》18000字.docx
- 《生物探究性实验教学》中小学教师资格模拟试题.docx
最近下载
- 组织生活会前征求意见和建议的情况报告集合.docx VIP
- 2020年全国高考全国一卷英语真题(含解析).pdf VIP
- _中国男性乳腺癌临床诊治实践指南(2023版).pdf VIP
- 标准图集-17J008 挡土墙(重力式、衡重式、悬臂式) 无水印.pdf VIP
- 管理沟通——原理、策略及应用(第三版)课件全套 赵洱岽 第1--14章 管理沟通概论---数字化时代的沟通.pptx
- 初二物理上册质量与密度练习题难题带答案1.pdf VIP
- DB31_T 416-2008 城市道路路名牌(法规规范).pdf VIP
- V83-CV100出入口车牌识别高清网络一体化摄像机操作手册20180427.pdf VIP
- 《再别康桥》优秀课件.ppt VIP
- 2026届高考政治总复习选必一高考主观试题答题模型总结(2023-2025年真题适配版).pdf VIP
原创力文档

文档评论(0)