改进的Q学习算法在作业车间调度中的应用.pdfVIP

  • 15
  • 0
  • 约 3页
  • 2017-08-10 发布于北京
  • 举报

改进的Q学习算法在作业车间调度中的应用.pdf

第28卷第12期 计算机应用 Vo1.28No.12 2008年 12月 ComputerApplications Dec.2008 文章编号:1001—9081(2008)12-3268—03 改进的Q学习算法在作业车间调度中的应用 王 超 ,郭 静 ,包振强 (1.扬州工业职业技术学院 电子信息工程系,江苏 扬州225009; 2.扬州大学 信息工程学院,江苏 扬州225009) (wangchao@ypi.edu.Cg1) 摘 要:在制造业系统中车间调度是一项关键技术,可以用强化学习中的Q学习实现对车间作业的动态调度。 传统的Q学习存在收敛速度慢和容易导致局部收敛的矛盾,为此提 出一种改进的Q学习算法。在行为动作上提 出了 一 种双层动作合成的动作组,给出常规数学中“聚度”概念来衡量在某一状态动作组选择的均匀程度 ,达到既能加速 收敛又能防止局部收敛的目的

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档