基于Q学习的任务调度问题的改进研究.pdfVIP

  • 22
  • 0
  • 约1.58万字
  • 约 6页
  • 2015-08-22 发布于未知
  • 举报

基于Q学习的任务调度问题的改进研究.pdf

无机材料学报

2012年 6月 图 学 学 报 June 2012 第 33卷 第3期 JoURNALoFGRAPHICS V01.33 NO.3 基于Q学习的任务调度问题的改进研究 刘晓平, 杜 琳, 石 慧 (合肥工业大学计算机与信息学院,安徽 合肥 230009) 摘 要:论文针对协同工作中的任务调度 问题,建立了相应的马尔可夫决策过程模 型,在此基础上提出了一种改进的基于模拟退火的Q学习算法。该算法通过引入模拟退火, 并结合贪婪策略,以及在状态空间上的筛选判断,显著地提高了收敛速度,缩短了执行时间。 最后与其它文献中相关算法的对比分析,验证了本改进算法的高效性。 关 键 词:任务调度;Q学习;强化学习;模拟退火 中图分类号:TP391 文献标识码:A 文 章 编 号:2095.302X(2012)03—0011—06 Improvementoftaskschedu

文档评论(0)

1亿VIP精品文档

相关文档