- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
AppManager_一种基于服务的机群任务管理系统
AppManager:一种基于服务的机群任务管理系统
叶庆华,肖利民,高文,梁毅,江滢,孟丹
国家智能计算机研究开发中心,中国科学院计算技术研究所,北京2704信箱邮编100080
E-m丑=il:(yeqh,xlm,gw,1wholly,cylindcr’md)@ncic.∞.cn
摘要机群系统以其卓越的性能价格比和良好的可扩展性等因素成为当今并行处理系统的主流方向.然而,其本
身松散耦舍的特性使得其强大的处理能力必须依赖于各种管理软件的支持.本文简要叙述了一种机群任务管理系
种基于服务的体系结构设计.不仅实现了传统的任务管理系统的基本功能,如资源管理,任务调度和监控,而且
提供了许多良好的特性,包括支持应用的广泛性、系统的可扩展性、应用的高可用·|生、算法的可扩展性等等.
关键词任务管理,机群系统.分布式构件.AppManager,ClustOrte
中图法分类号:TP3 文献标识码:A
1.引言
机群系统由于其良好的可扩展性和卓越的性能价格比,成为高性能计算机系统的主流体系结构。如今,机群
技术已经被普遍应用到科学计算、internet网络服务和数据库服务中。
机群任务管理系统作为机群系统的重要组成部分,将系统的分散的资源整合起米,为用户提供了一个单一的
系统映像,使用户感觉在使用一台计算机那样方便,同时能够极大地提高了机群系统的使用率和利用率。它也使
得用户可以在机群系统中配置、提交、监控他们的任务。但是,随着越来越多的应用被移植到机群系统中,机群
系统对任务管理提出了更高的要求。例如.支持应用的多样性,应用的高可用保证等等。为了满足越来越多的应
用的需求,我们殴计和实现了这样一个功能完善的机群任务管理系统—^ppManager。
本文着力刻画了AppManager的设计和实现。在第二节中.我们总结了任务管理系统面临的一些挑战性的需
AppManager及其相关工作,并对今后的工作做了展望。
2.任务管理的需求
任务管理在机群系统中发挥着非常重要的作用。一般来说,它为用户提供了一些工具,方便用户提交、执行
和监控他们在机群系统中的应用程序。但是,随着越来越多的应用被移植到机群系统中,对机群任务管理提fJl了
愈来愈多的需求和挑战。下面我们列出一些主要的需求:[1][2][3][4],
夺 支持应用类型的多样性:机群任务管理系统必须能够支持各种不同的应用,包括交互式和批处理任务,串
行和并行应用,科学计算和嘲络服务等等。
夺 调度算法的可扩展性:任务管理不仅能够提供多种优化的调度算法供用户选择,提高吞吐率、系统利用率
和用户公平性.还应该提供一种机制,使用户能够根据不同的计算需求修改和替换已有算法,加入新算法。
+ 应用的高可用性:任务管理应该保证一些关键应用的高可用性。它能自动探测系统故障,并且恢复相关的
应用到备份系统中。
争 资源的可管理性:任务管理必须能够定义、配置、分配和控制整个机群系统中的各种资源。
夺 任务的可监控性;机群任务管理使得用户可以方便地提交、删除、控制、暂停、恢复和终止他们的任务。
十 系统的高可用性:为了提供一致性的服务,任务管理系统本身应该具有较高的可靠性和较低的故障率.并
且能够从可能的系统失效中恢复。系统的高可用性也是保证应用高可用性的前提条件。
夺 系统的好用性:任务管理系统不但需要提供一个友好的用户界面,使用户方便地使用备种功能,而且应该
允许用户图形界面(GUI)、Internet应用和网格软件通过Internet直接调用该系统的功能。
作者简舟:叶庚华.男,硕士生,主要研究方向为机群操作系统:肖利民,男,博士,副研究员,主要研究领域为离性能计算机体最
结构厦操作系统;高文.女.博士,主要研究领域为机群高可用系统;江滢,女.硕士生,主要研究方向为机群管理:粱毅,女,博士生.
主要研究方向为机群费源管理;盂丹,男,博士.研究员,主要研究领域为高性能计算机体系机构.操作系统
平台的无关性:任务管理系统不能过于依赖底层耵L群系统平台。它应该能够支持多种主流的机群系统.例
如Linux机群。同时,应该考虑支持异构的机群系统。
夺 系统可扩展性:机群任务管理系统应该能够扩展到不同规模的机群系统中,包括功能扩展和性能扩展,即
随着机群系统规模的扩大,功能和性能不应该受到影响。
夺 系统安全性:用户的身份必须得到严格的认证。在系统的各个部件中传送的用户身份和消息必须足安全的,
小能假冒或更改。系统的记账信息必须足真实的,关键数据不能伪装。
尽管有一些系统做了很大
您可能关注的文档
- AHP层次分析法在设备维修决策中的应用_曹勤.pdf
- AHP在第三方物流服务商选择中的应用.pdf
- AHP方法计算.xls
- AHP法中平均随机一致性指标的算法及MATLAB实现.pdf
- AICPA考试考前备考黄金指导之金融英语阅读篇.doc
- Aitken_Neville_Newton插值法计算过程的等价性.pdf
- AHP软件层次分析.doc
- AI中英文对照.doc
- AIX的基本命令.doc
- AI考试 复习资料.doc
- Approximate Separability for Weak Interaction in Dynamic Systems.pdf
- Aptitude Evaluation Answer Sheetcandidate.xls
- apr中内存分配子的current_free_index成员作用.pdf
- AP物理和生物考前过一遍.docx
- ArcEngine 渲染的使用.doc
- ArcGISAPIForSilverlight实例分析.doc
- arcgisengine开发的实验.doc
- ArcGIS中两种网络分析对比.doc
- ArcGIS利用制图表达制作粗细不等的河流.docx
- ArcGISWorkstation网络分析.doc
最近下载
- 测量坐标转换为导入cass软件dat形式的方法.docx
- 术中获得性压力性损伤手术室全程管理专家共识.pptx
- BS EN 50050-2-2013 静电手持喷涂设备,安全要求手持喷涂设备可燃性粉末涂料.pdf
- 2025年《汽车检测与诊断技术》期末复习试题2套含答案 .pdf VIP
- 运筹学课件 第一节 运筹学释义与发展历史.ppt VIP
- 最优化理论在智能制造系统设计中应用.docx VIP
- 学习二十届中纪委四次全会精神答题.doc VIP
- 毕业设计(论文)-吸盘式板材搬运工业机器人设计.doc
- 双层升降横移式立体车库毕业设计书.doc VIP
- 七年级下册英语课件Unit 6《Rain or Shine》(Section A 1a-1d).pptx VIP
文档评论(0)