网站大量收购独家精品文档,联系QQ:2885784924

作业与资源管理系统.pptVIP

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.RMS的组成与结构 2.5 一个现代体系结构的特点 RCODINE(Computing in Distributed Networked Environment)和补充的GRD(Global Resource Direnctor),即CODINE/GRD,是基于现代体系结构的RMS系统 。CODINE/GRD都采用客户/服务器方式模式设计的。其功能由三种类型的守护进程提供: cod_qmaster:CODINE/GRD的主守护进程。是计算集群管理和调度活动的中心。Cod_qaster维护主机表、配置队列表、负载信息表和用户权限表。 cod_shedd:是CODINE/GRD的调度器。其功能是计算任务分配方案,将最后的方案发给cod_qmaster cod_exced:执行队列和队列中的作业 2.RMS的组成与结构 2.5 一个现代体系结构的特点 这三个进程是基于TCP/IP通信系统进行通信的,由cod_commd提供 目录 3.RMS的当前技术发展情况 3.1 基于自动策略的资源管理 高级资源利用策略以及自动增强的定义为RMS和它们的应用提供了一个新的功能层面:资源共享中心为不同的组织单元提供服务。提供这种能力的RMS已经可以使用,下面以GRD系统为例介绍自动管理策略的目标和功能 需求和目标 工作负载管理,是控制共享资源计算机使用,以最大程度的获得性能和目标。它是通过资源管理策略和尽量最大化资源利用率和系统吞吐量的工具来实现的。 为完成这些目标,管理解决方案需要比较有竞争关系的作业的重要性并将相同的并发作业关联。如果缺乏这种机制,将会有下列缺陷: 3.RMS的当前技术发展情况 3.1 基于自动策略的资源管理 应用程序很少会获得最佳的执行性能 重要的作业可能被延迟 未经授权用户通过大量提交作业,可能会获得较多系统资源 降低资源利用率,减少了吞吐量。并且需要更多的操作和管理介入 量化资源的可利用性和可利用程度 为防止作业不正当分配,任何地方的作业和他们的用户、工程和部门以及作业类相关联,以决定当新的作业提交时如何分配资源。 3.RMS的当前技术发展情况 3.1 基于自动策略的资源管理 策略模型 前面叙述过的资源管理策略,这里就不赘述 基于共享的 功能的 最后期限的 手工重载 下图对这些策略进行了综合描述 3.RMS的当前技术发展情况 3.1 基于自动策略的资源管理 3.RMS的当前技术发展情况 3.1 基于自动策略的资源管理 前面的策略是基于动态调度来实现的。这与大多数静态RMS调度行为差别很大。 3.RMS的当前技术发展情况 3.1 基于自动策略的资源管理 3.RMS的当前技术发展情况 3.2 作业支持的当前状况 对不同类型的作业,当前最先进的RMS提供了如下服务。 串行批处理作业 支持提交批处理作业,提供全面监控和记账的工具。 交互式支持 在RMS中,对于交互式作业,一个方法是打开一个完全交互的会话窗口。另一个方法是提供了一个终端连接(如LSF)。 并行支持 几乎所有RMS系统都支持并行,但是它们提供的支持由很大不同。 1.支持任意的或特殊的PPE(并行程序设计环节的接口) 3.RMS的当前技术发展情况 3.2 作业支持的当前状况 有俩种方式。一种是RMS系统中集成对一个或者多个PPE的支持接口。另一种方式是提供给PPE的那个接口是可以配置的,以便于任意一个程序设计环境进行集成。 检查点 一些RMS,如CODINE/GRD,CONDOR,LoadLeveler和LSF等,都给出了处理检查点作业的机制。但是LoadLeveler和LSF、Condor提供的是基于库的检查点机制。CONDINE/GRD没有提供检查点库。它们之间的区别在于应用范围。基于库的检查点机制不适用于第三方程序。 4.现在和将来所面临的挑战 下面提到的需求问题在现在或是将来会变得很重要,但是当前大多数RMS没有提供合适的解决办法。 4.1 开放接口 由于用户环境并不是严格的同构的,所以需要UNIX上的RMS需要集成到具有自己界面的第三方应用程序的开放环境以及开放系统管理软件中。 RMS需要应用程序接口(API),CODINE/GRD提供的API主要特点是: 适用于CODINE/GRD的任何客户/服务器模式 扩充简单 有一个SQL接口 4.现在和将来所面临的挑战 4.2 资源控制与类似大型机的批处理 理想情况下,RMS可以控制很多可利用资源。但是大多数UNIX只为单个线程提供了资源限制。这样系统就无法提高可靠的资源控制 4.现在和将来所面临的挑战 4.2 异构并行环境 使用专门机器提供计算服务的计算中心需要更好地将并行机集

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档