- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
作业管理系统中数据放置子系统设计.doc
作业管理系统中数据放置子系统设计
摘 要:JobManager作业管理系统是众多作业管理系统中的一员。随着计算机应用的增加和巨大的数据需求,JobManager作业管理系统对数据的放置也提出了更高的要求。提出了JobManager作业管理系统的数据放置问题,并为该问题设计了详细的数据放置子系统体系结构。
关键词:作业管理;数据放置;调度;分布式
DOIDOI:10.11907/rjdk.162492
中图分类号:TP319
文献标识码:A文章编号:1672-7800(2016)012-0048-03
0 引言
JobManager作业管理系统中的数据密集应用对大块I/O的需求越来越大,在广域网中处理和复制大量数据,带来数据放置的可靠性和效率问题。查找、传输、使用和复制数据,数据管理器要在需要的时候对数据进行分配和释放,并在用户使用完数据之后清空所有使用痕迹。
数据放置活动是整个JobManager作业管理系统中的关键因素,对数据的访问通常是数据密集应用中的瓶颈[1]。
1 数据放置子系统结构
JobManager作业管理系统提供了一个数据放置子系统来解决数据放置问题,这个子系统包括数据放置的专业调度程序,一个用于了解数据放置的作业分析器,一个从记录中提取有用信息并给予解释的知识库,以及一些实时优化工具[2]。这种数据放置子系统提供完整的可靠性、用户的抽象能力、在存储服务器上的平衡负载能力和控制网络中的交换能力。
在远程作业执行过程中,数据放置是整个作业执行的重要环节。当前解决这个问题的方法是手工或者使用简单脚本,没有任何自动化和容错能力,不适应分布式计算环境的剧烈变化。它们对作业没有权限,作业在整个过程中没有调度。
为了解决这些问题,数据放置作业在分布式计算环境中必须像计算作业一样成为第一类作业,它们需要排队、调度、监控和检查。更加重要的是,必须在没有人为干预的情况下成功执行。
因此,可为JobManager作业管理系统设计一个数据放置子系统来专门处理数据放置问题。数据放置子系统结构如图1所示。下面对数据放置子系统各模块进行介绍。
2 数据放置子系统模块
2.1 作业描述
在介绍数据放置子系统作业描述之前,有必要介绍JobManager作业管理系统中的作业和作业流,在此基础上,对数据放置作业和计算作业使用不同的作业描述。
2.1.1 单元作业(UnitJob)
在作业管理系统中,单元作业是可被执行的基本单位。
在作业管理系统中,通常需要自动执行一系列作业,如果这些作业满足一定的执行逻辑或者称之为作业依赖关系,那么将这些作业按照一定的依赖关系定制成一个作业流是一种很好的解决方式。
作业流在作业管理系统中也称为作业网络,是相互关联的作业形成的一个作业序列。它的基本工作单元是作业。每个作业流都有一个虚拟的开始点和结束点。不含任何作业的作业流叫空作业流[3]。作业流是作业管理系统管理和调度的基本单元,作业不能脱离作业流而单独提交给系统。
2.1.2 作业网络图
作业流程图又称为作业网络图,是按照一定的逻辑关系将用户定义的作业组织成一个网状图,是作业流的图形表现形式。在作业管理系统中,一个作业流中既包含了多个传统意义上可执行的作业,又包含了作业之间的依赖关系,还有一种关系是作业流之间的依赖关系。作业之间的依赖关系以及作业流之间的依赖关系是作业流参考模型的显著特点,能够大大提升作业流的表达能力和执行能力。
2.1.3 结构化作业流
在基于作业流的作业管理系统中,可以构造出各种复杂的作业网络,以更好地控制作业的执行顺序。本文所研究的作业管理系统中,可以使用相关作业表示出顺序、条件/分支、循环3种基本的执行结构,形成结构化作业流。
(1)顺序。作业执行顺序是前后关系,前一作业执行完毕,后一作业再开始执行,见图2。
(2)条件/分支。条件/分支根据执行条件决定作业网络的执行走向,见图3。
(3)循环。循环执行类似于程序语言中的do-while。利用跳转作业来指定要循环执行的目标作业及重复次数,见图4。
obManager作业管理系统中的数据密集应用需要从远程站点到执行站点移动输入数据,执行作业,然后将输出数据从执行站点移动到原来或者是另一个远程站点。如果不希望在执行站点出现用尽磁盘空间情况,就需要在传输数据前分配空间,并且在移动输出数据后释放空间。
作业描述模块需要将这些计算和数据放置步骤使用不同的作业描述。将原来一个单元作业分解为计算作业和数据放置作业的集合,以便对数据放置作业进行下一步操作。
2.2 作业分析器
作业分析器获得用户定义的作业描述后,将
您可能关注的文档
- 优质芹菜高产栽培技术.doc
- 优质酿酒葡萄无公害栽培技术分析.doc
- 优质香禾糯新品种苟当2号的选育过程及栽培技术.doc
- 优质马铃薯高产栽培.doc
- 优质高产两系杂交中稻广两优35的特征特性及高产栽培技术.doc
- 优质高产加工型皮燕麦新品种安瑞的选育及栽培技术.doc
- 优质高产玉米栽培法.doc
- 优质高产脱毒马铃薯种植技术.doc
- 优质高产马铃薯栽培技术.doc
- 伙伴选择、伙伴控制与供应商网络治理.doc
- 金融产品2024年投资策略报告:积极适应市场风格,行为金融+机器学习新发现.pdf
- 交运物流2024年度投资策略:转型十字路,峰回路又转(2023120317).pdf
- 建材行业2024年投资策略报告:板块持续磨底,重点关注需求侧复苏.pdf
- 宏观2024年投资策略报告:复苏之路.pdf
- 光储氢2024年投资策略报告:复苏在春季,需求的非线性增长曙光初现.pdf
- 公用环保2024年投资策略报告:电改持续推进,火电盈利稳定性有望进一步提升.pdf
- 房地产2024年投资策略报告:聚焦三大工程,静待需求修复.pdf
- 保险2024年投资策略报告:资产负债匹配穿越利率周期.pdf
- 政策研究2024年宏观政策与经济形势展望:共识与分歧.pdf
- 有色金属行业2024年投资策略报告:新旧需求共振&工业原料受限,构筑有色大海星辰.pdf
文档评论(0)