- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
计算集群中一种基于任务运行时间的组合预测方案
余莹;李肯立;徐雨明
【摘要】针对现有单一预测策略不适用于所有异构任务的问题,提出一种基于本地
任务与远程任务运行时间的组合预测方案(CPS)和预测精度保证(PAA)的概念.使用
GridSim工具集来实现CPS,将PAA作为定量评价由某一特定预测策略提供的预测
运行时间精度的标准.仿真实验表明:与本地任务预测策略如Last和滑动窗口中值
(SM)相比,CPS的平均相对残差下降了1.58%、1.62%;与远程任务预测策略如平
均运行时间(RM)和加权移动平均值(ES)相比,CPS的平均相对残差下降了1.02%、
2.9%.因此,PAA能从综合策略所提供的结果中选择接近最优值的预测,CPS增强了
计算环境中本地任务和远程任务运行时间的PAA.
【期刊名称】《计算机应用》
【年(卷),期】2015(035)008
【总页数】6页(P2153-2157,2163)
【关键词】计算集群;组合预测方案;预测精度保证;任务;运行时间
【作者】余莹;李肯立;徐雨明
【作者单位】衡阳师范学院计算机科学系,湖南衡阳421002;湖南大学信息科学与
工程学院,长沙410082;湖南大学信息科学与工程学院,长沙410082
【正文语种】中文
【中图分类】TP393.027;TP18
0引言
集中式和分布式大型高性能计算系统为越来越多的研究和生产应用提供服务。它们
能够获得巨大的计算能力,这种计算能力可用于执行计算密集型的应用程序。集群
计算环境协调属于不同组织和个人的分布式资源,允许聚集和共享异构资源,具有
规模效益、成本效益和易于扩展的经济优势。然而,多站点异构资源结构和动态异
构工作负载的挑战,限制了系统资源的有效实用性。
根据集群计算环境中的调度模型,用户需要提供所需计算资源的具体要求,包括任
务提交后的实际运行时间。然而,不同规格任务通过不同平台执行,它的运行时间
有很大差别。任务运行时间的高可变性使用户使用系统变得困难,因此,有一些预
测策略已用来解决这个问题。预测准确,不仅是提前预留时协助有效调度和未来规
划资源分配的需要,同时对提高资源用户和资源所有者的满意度也是非常有用的。
从用户的角度来看,任务被合理分派给一个成本越低的资源,而所得到的服务也是
越满意的。然而,从资源所有者来看,任务派遣的方式应该是所有资源满负荷工作
以保持低成本,在没有突破预设的服务水平协议(ServiceLevelAgreement,SLA)
情况下获得最大收益[1]。毫无疑问,这些问题都需要准确预测运行时间。
然而,现有预测战略的特点决定了单一的策略无法适应各种异构任务。在集群计算
环境中,有两种类型的任务:本地任务和远程任务。本地任务比远程任务具有更高
的优先级,所以是一种抢占计算资源现象[2],因此,本文的研究工作是设计一
个组合预测方案(CombinedPredictionScheme,CPS),通过综合现有预测策略
优势分别来预测本地任务和远程任务的运行时间。同时还介绍了一种名为预测精度
保证(PredictionAccuracyAssurance,PAA)的评价标准来评估通过综合策略得
到的预测结果的精度,采用提供了最佳预测精度保证的预测结果。
1相关工作
现在已尝试采用多种策略去建模和预测所提交任务的运行时间。文献[3]提出了
以静态分析、分析基准和编译器方面为基础的一套方法和体系结构,其中程序是以
段为单位进行分析的,这些段的执行时间组合在一起就是程序的总运行时间。文献
[4]建议的预测策略采用K-最近邻算法进行预测,统计模型和时间序列都是以历
史数据为基础的,不需要任何内部设计和算法的知识,但不能缺少以前观测的历史
数据。文献[5]指出,任务运行时间很可能依赖于某些特定的资源配置类型,并
提出了一种预测运行时间的建模方法,以应用资源的使用行为为基础,不使用侵入
性技术,如代码检查或测量。该模型是跨平台的,预测不需要在目标计算平台上第
一时间被描述。神经网络方法也被用来预测运行时间,如文献[6]提出一种名为
混合贝叶斯神经网络的方法,构建了一个贝叶斯网络来代表不同因素影响运行时间
下的性能概率分布,神经网络则利用这些概率分布提供一个计算有效且精确的预测。
文献[7]中描述了一种不同的策略,提出了一种使用“相似模板”的系统,任务
的特点是考虑它们在不同网格基础设施水平的属性,然后通过确认被记录和提交任
务有类似属性的最适合的模板来推导预测结果。上述方法对具体任务使用单一的预
测策略。文献[8]提出了一种新颖的非线性时间序列
文档评论(0)