联想作业管理系统.pdf

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
联想作业管理系统联想作业管理系统联想作业管理系统联想作业管理系统 年33月月 需求分析需求分析需求分析需求分析 系统概述系统概述系统概述系统概述 系统使用系统使用系统使用系统使用 AA Q Q 高性能计算机的应用领域正迅速扩展 科学计算科学计算 产品设计 生物科学探索生物科学探索 ... 如何既能方便用户管理作业,又能有效利 用机群系统的各种软硬件资源用机群系统的各种软硬件资源,从而提高系统从而提高系统 的资源利用率和吞吐率呢? 需求分析需求分析需求分析需求分析 系统概述系统概述系统概述系统概述 系统使用系统使用系统使用系统使用 AA Q Q ••系统定义系统定义 机群作业管理系统是建立在操作系统与用 户程序之间的一种系统中间件户程序之间的一种系统中间件。。 ••主要目的主要目的 方便用户管理作业,合理选择作业调度策 略略,,统一管理机群系统的各种软硬件资源统一管理机群系统的各种软硬件资源,, 提高系统的整体资源利用率和吞吐率提高系统的整体资源利用率和吞吐率。。 主要由用户服务器主要由用户服务器主要由用户服务器主要由用户服务器serverserverserverserver、、、、作业调度作业调度作业调度作业调度 器器器器schedschedschedsched、、、、结点执行器结点执行器结点执行器结点执行器mommommommom和客户端等四部和客户端等四部和客户端等四部和客户端等四部 分组成。其中分组成。其中serverserver、、schedsched和和mommom为守护为守护 进程进程进程进程,,,,三者之间协同工作三者之间协同工作三者之间协同工作三者之间协同工作,,,,共同实现作业共同实现作业共同实现作业共同实现作业 管理管理管理管理、、、、作业调度和负载平衡等功能作业调度和负载平衡等功能作业调度和负载平衡等功能作业调度和负载平衡等功能。。。。原理原理原理原理 如下图如下图11--11所示。所示。 内核内核 调度策略调度策略 事件事件 MOM sched Server 正在处理 作业 的事件的事件 单机环境下的机群作业管理系统 主要包括作业管理、作业调度、资源管主要包括作业管理、作业调度、资源管 理、系统监控、故障恢复、记帐等功能。理、系统监控、故障恢复、记帐等功能。 ••作业管理作业管理 作业管理包括提交作业管理包括提交、、查看查看、、修改修改、、删除删除、、 挂起挂起//恢复恢复、、移动和传送作业等移动和传送作业等。。 ••作业调度作业调度 由调度算法决定,我们目前提供的调度 策略有策略有FIFOFIFO、、RESERVATIONRESERVATION和和BACKFILLBACKFILL 等,用户可以根据需要灵活配置。 ••资源管理资源管理 管理的对象包括服务器管理的对象包括服务器、、队列队列、、结点等结点等,, 管理方法是动态地增加管理方法是动态地增加、、删除对象删除对象,,设设 置、修改对象的属性。 ••系统监控系统监控 用户通过查看机群系统中各个结点的状用户通过查看机群系统中各个结点的状 态(如空闲、繁忙、作业独占、脱机或 故障),决定使用哪些结点来提交作业, 实现负载平衡实现负载平衡。。 系统功能(三)系统功能(三) ••故障恢复故障恢复 服务器进程的服务器进程的 ““故障恢复故障恢复””选项选项,,可以可以 恢复处于恢复处于 ““排队排队””和和 ““运行运行””状态的作状态的作 业,使其继续运行或重新调度,保证用

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档