YARN架构原理与MapReduce核心机制优化分析.pdfVIP

YARN架构原理与MapReduce核心机制优化分析.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1.1.原MapReduce框架的不足

1.2.新版YARN架构的优点

2.YARN的重要概念

2.1.ResourceManager

2.2.NodeManager

2.3.ApplicationMaster

2.4.MRAppMaster

2.5.Container

2.6.Scheduler

2.7.YARNScheduler

2.7.1.FIFOScheduler

2.7.2.CapacityScheduler

2.7.3.FairScheduler

2.7.4.配置使用

3.YARN架构及各角色职责

4.YARN作业执行流程

1.YARN概述

YARN(YetAnotherResourceNegotiator),是开源ApacheHadoop分布式处理框架中的资源管

理和作业调度技术。它为上层应用统一的和调度,它的引入为集群在利用率、资源统一管

理和数据共享等方面带来了巨大好处。作为ApacheHadoop的组件之一,YARN负责将系统资源

分配给在Hadoop集群中运行的各种应用程序,并调度要在不同集群节点上执行的任务。它相当于一个

分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。

YARN是Hadoop-2.x版本中的一个新特性。它的出现其实是为了解决第一代MapReduce编程框架的

不足,提高集群环境下的资源利用率,这些资源包括内存,磁盘,网络,IO等。Hadoop-2.X版本中重

新设计的这个YARN集群,具有更好的扩展性,可用性,可靠性,向后兼容性,以及能支持除

MapReduce以外的分布式计算程序。

YARN的基本思想是将和作业调度/监视的功能分解为单独的daemon(守护进程),其拥有一个

全局ResourceManager(RM)和每个应用程序的ApplicationMaster(AM)。

1、YARN并不清楚用户提交的程序的运行机制

2、YARN只运算资源的调度(用户程序向YARN申请资源,YARN就负责分配资源)

3、YARN中的主管角色叫ResourceManager

4、YARN中具体运算资源的角色叫NodeManager

5、这样一来,YARN其实就与运行的用户程序完全解耦,就意味着YARN上可以运行各种类型的分布式

运算程序(MapReduce只是其中的一种),比如MapReduce、Storm程序,Spark程序,Tez程序,

……

6、所以,Spark、Storm等运算框架都可以整合在YARN上运行,只要他们各自的框架中有符合YARN规

范的资源请求机制即可

1.1.原版MapReduce框架的不

足1.2.新版YARN架构的优点

2.YARN的重要概念

2.1.ResourceManager2.

2.NodeManager2.3.

ApplicationMaster2.4.

MRAppMaster2.5.容器

2.6.调度程序2.7.YARN调

度程序2.7.1.FIFO调度程

序2.7.2.容量调度程序2.

7.3.公平调度程序2.7.4.配

置使用

3.YARN架构及各角色职责

4.YARN作业执行流程

1.YARN概述

YARN(YetAnotherResourceNegotiator),是开源ApacheHadoop全局处理框架中的和作业

调度技术。它为上层应用统一的和调度,它的引入为集群在资源、资源统一管理和数据共

享等方面带来了巨大的好处。作为ApacheHadoop负责的之一,YARN组件系统将资源分配给在

Hadoop集群中运行的各种应用程序,并调度在不同集群节点上执行的任务。操作系统的平台,而

MapReduce等程序则实际上运行于操作系统之上的应用程序。

YARN是Hadoop‑2.x版本中的一

文档评论(0)

daluobu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档