- 0
- 0
- 约7.2万字
- 约 12页
- 2026-03-17 发布于北京
- 举报
SARN:适用于YARN的可扩展框架
陆中浩,齐琦
网络与交换技术国家重点,邮电大学,,,
16uzhonghao,wangjingyu,qiqi}@
0087邮箱:{l
:随着互联网的快速发展,我们已经进入了大硬件资源,有必要提出一种策略,用于空闲容
数据时代。在大数据时代,HadoopYetAnother器和繁忙容器,使容器在空闲时释放资源。本文介
ResourceNegotiator(YARN)是常用的大数据处绍了一种可扩展的YARN框架,并将底层
理框架之一。YARN了对多种编程模型的支持,云计算平台与YARN集成,实现了动态容器在任务
因此像Storm、HBase和Hive这样的多个框架可生命周期中动态缩减和扩展资源(目前仅限内存)。
以作为应用程序在YARN上运行[1]。为了更好地该框架中的SARN组件可以自动管理和协调集群上
利用硬件资源并提高集群效率,提出了一种可扩展运行的任务资源。
框架(SARN)。SARN包括动态容器和
快速部署组件,可以弹性地扩展或缩减YARN工作
节点的数量以满足多个任务的实际资源需求。我们
本文的其余部分结构如下。第2节介绍YARN的相关
在空闲模式(集群空闲)和急切模式(集群资源相
工作。第3节阐述我们的动机,并在第4节简要介绍
对不足以满足应用程序的需求)下进行了实验。实
SARN框架。第5节通过实验评估SARN在两种模式
验结果表明,该方法在这两种情况下都能提高应用
下的性能。最后,第6节总结全文。
程序的性能。
:YARN;动态容器;框架2相关工作
YARN相比Hadoop的早期版本有许多改进。早期版
1引言本的Hadoop存在集群最大规模为4000个节点和最
随着大数据处理和云计算的快速发展,Hadoop大并发任务数为40000等缺点。数据计算框架由一个
YARN成为了这一领域中最著名的工具之一。虚拟机全局器(RM)和节点从属节点管理器(
在机创建,并且这些虚拟机可以用于托管各NM)组成。YARN将JobTracker的主要功能,即
种服务,如、计算、操作系统和软件。许多组织和作业调度/,拆分为单独的守护进程
出于成本效益考虑,更倾向于将计算任务转移到云上。[3][4]。
同时,大规模并行计算需要YARN框架。该框架最Gupta等人[5]提出了一种吞吐量调度器来管理集群
初由谷歌使用,后来被雅虎采用,最终成为资源,并了一种在多集群系统中运行多个
Apache下的一个开源项目,命名为Hadoop[1]。MapReduce框架实例的方法,以动态地扩展或缩减
传统数据库无法处理的数据被称为大数据。虽然有许每个MR实例的资源。然而,吞吐量调度器不支持在
多解决方案可以处理大数据,但最常见和广泛使用的应用程序生命周期内更改容器资源。
是HadoopYARN[2]。YARN可以定义为在多台机
器和服务器上的分布式处理。它是一种专门用于数据
您可能关注的文档
- 种子植物门Spermatopa:定义、特征与分类.pdf
- 数组基础与操作详解:声明、初始化及遍历.pdf
- 12月亚洲妈品牌档期改进方案:提升产品质量与品类优化策略.pdf
- 2026年春江苏开放大学宪法学060856第一次作业答案.doc
- 早发现、早介入、早化解——高一年级班级矛盾隐患闭环管理工作机制.doc
- 2026年春江苏开放大学宪法学060856第一次作业答案.docx
- 人教版6年级数学:绵阳育才学校2013下期六年级诊断性考试(二)数学试卷.doc
- 2026年春江苏开放大学施工安全技术与管理060982形考作业1答案.docx
- 年度预算管理制度.doc
- 年度预算管理制度.pdf
- 党委2026年党建工作要点.pdf
- 年度预算管理制度.docx
- 2026年春江苏开放大学总书记关于教育的重要论述研究060702考核作业1.pdf
- 2026年春江苏开放大学总书记关于教育的重要论述研究060702考核作业1.docx
- 2026年春江苏开放大学施工安全技术与管理060982形考作业1-3答案.pdf
- 2026年春江苏开放大学施工安全技术与管理060982形考作业1答案.doc
- 2026年春江苏开放大学施工安全技术与管理060982形考作业1-3答案.docx
- 2026年春江苏开放大学施工安全技术与管理060982形考作业1答案.pdf
- 早发现、早介入、早化解——高一年级班级矛盾隐患闭环管理工作机制.pdf
- 2026年春江苏开放大学总书记关于教育的重要论述研究060702考核作业1.doc
原创力文档

文档评论(0)