云环境下科学工作流的两阶段数据放置与任务调度策略课程.pptx

云环境下科学工作流的两阶段数据放置与任务调度策略课程.pptx

云环境下优化科学工作流执行性能的 两阶段数据放置与任务调度策略;摘要;主要内容;引言;引言;引言;引言;引言;二、相关工作;二、相关工作;三、科学工作流形式化描述和问题分析 ;定义2 原始数据集设为DSini={d1,d2,d3…} DSini表示在科学工作流建立时所存在的数据集,即所有原始输入。 中间数据集设为DSgen={d1,d2,d3…} DSgen表示在科学工作流执行过程中所产生的数据集。 固定数据集和非固定数据集分别设为FD和NFD.FD表示必须放置在固定数据中心的数据集,这是因为某些数据需要特定数据中心的特定设备才能处理,或者某些数据具有私有性和产权性.NFD表示没有固定数据中心的数据集,这是相对FD而言。 定义3 T={t1,t2,t3…} 表示在科学工作流上运行的任务集,每一个任务执行都需要若干数据集作为输入。 定义4 di=〈Ti,si,dci,fix_flag,deplink〉 di表示科学工作流中编号为i的数据集。 Ti={t1,t2,t3…}表示使用di的任务集合; si表示数据集的大小; dci表示di所对应的数据中心; fix_flag为true表示di是固定数据,反之则为非固定数据; deplink是一个链表。( depij与数据集大小有关。

文档评论(0)

1亿VIP精品文档

相关文档