- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于多维聚类预处理的云计算任务调度算法.doc
一种基于多维聚类预处理的云计算任务调度算法
摘要:文章主要介绍了一种基于多维聚类预处理的云计算任务调度算法,根据预先分类好的资源特征向量进行分类依据,将云计算资源与特征向量间的相似度距离作为测度函数,将资源划分到预先定义好的类别中。本调度算法对资源进行分类预处理,能有效缩小任务对于资源搜索的范围,从而提高任务调度的速度。关键词:特征向量;相似度测度;任务调度
1 研究背景
云计算主要采用虚拟化技术将数据中心的物理资源虚拟化为资源节点后,进行统一管理和对外服务。用户享受的服务质量水平将会和所需支付的费用成正比。正是由于用户的不同需求,云任务调度器需要为用户任务选择合适的资源,最大限度地满足用户对于服务质量的需求,提高资源利用率,维持资源负载均衡。因此,研究云环境下的任务调度算法意义重大。
2 聚类分析法原理
聚类分析是根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。通常是用样本间的相似系数来描述其亲疏程度。有了相似系数就可定量地对样本进行分组,根据分类函数将差异最小的归为一组,组与组之间再按分类函数进一步归类,直到所有样本归为一类为止。
3 算法描述
本算法的目标是找到对资源集的一个划分,使资源性能相近或相似的节点聚在一起共同构成一个分类类别。算法的主要思想是:
(1)对训练集中的云系统资源向量事先进行手工粗分类,分为:计算型,转发型,存储型,计算出每一类的特征向量F(xi)={x1,x2,x3,…,xn)。
(2)对测试集中的云系统资源向量建立初始样本矩阵:S(yt)=(y1,y2,y3,…,yn)。
(3)用类间的相似系数来描述其亲疏程度,计算每个资源向量与各个大类的特征向量间的相似性测度函数。
Mj=(F(x1),S(yj))=(m1,m2,m3)
相关性系数定义为向量的单位化内积:
根据相似性测度函数Mj=(F(x1),S(yj))的值,根据模式分类的原则:
C(z)=ArgMiaxMj(F(x1),S(yj))
(4)比较和Si最相似的类,从而确定该资源向量的分类,将该资源和大类归并为一个类别。
(5)重复执行上述操作,直到资源池中所有资源向量都只属于同一个分类类别为止,即所有资源节点都有明确的分类类别。
(6)在每个大类中,将资源按照综合性能进行降序排序,性能较好的资源将优先被调度。
(7)对资源进行分类预处理后,在已有的分类类别中选择性能最优的资源,最大限度地体现了任务调度的公平性。
4 算法性能分析
在任务调度系统中,用户提交任务的最终完成时间取决于该任务集中所有任务的完成时间,也就是任务完成时时间最大的任务。
任务i预期完成时间L主要由队列等候时间、处理和存储时间、转发延迟时间组成。
队列等候时间可用公式(1)计算得出:(1)
Q(i)表示任务Ti在分类类别中在任务队列中等待调度的时间,n表示任务i前面的任务数,Tj表示第j个任务的预期完成时间。
处理和存储时间可用公式(2)计算得出:(2)
S(i,k)表示任务Ti使用资源k时,所需的计算执行时间,tci表示任务计算量,rcalk表示资源K的计算能力,tsi表示所需存储的任务量,rstork表示资源K的存储能力。
转发延迟时间可由公式(3)计算得出:(3)
F(i,k)表示任务i使用K源后,转发任务结果所需的传输时间,tdatai指任务输出数据量,rcomk表示资源K的通信带宽能力。
因此,任务预期完成时间可以表示为:
Ti=Q(i,k)+S(i,k)+F(i,k) (4)
使用CloudSim仿真平台,将本调度算法(以下简称GCCTS)与Min-Min和Max-Min算法进行模拟实验调度,数据取自模拟20次取得的平均值。从调度策略的平均完成时间对3种算法进行性能比较。图1所示为资源数为20时,3种算法任务平均完成时间的比较图。图2所示为资源数为50时,3种算法任务平均完成时的比较图。
由以上分析可以看出,Min-Min算法由于每次优先选择任务完成时间最小的任务执行,因而任务最终完成时间小于Max-Min算法,但次于GCCTS算法。
5 结语
文章主要介绍一种基于多维聚类预处理的云计算任务调度算法。首先介绍了聚类分析方法,论述分类方法的具体实现步骤,利用该方法将资源划分到预先定义好的分类类别中。然后详细介绍算法的主要思想、伪代码实现,并经过对模拟环境下的实验数据分析,本调度算法对资源进行分类预处理,能有效缩小任务对于资源搜索的范围,从而提高任务调度的速度。
该调度策略仍然存在很
文档评论(0)