改进的Q学习算法在作业车间调度中的应用.pdfVIP

下载本文档

15
0
约 3页
2017-08-10 发布于北京
举报

改进的Q学习算法在作业车间调度中的应用.pdf

第28卷第12期计算机应用 Vo1．28No．12 2008年 12月 ComputerApplications Dec．2008 文章编号：1001—9081(2008)12-3268—03 改进的Q学习算法在作业车间调度中的应用王超，郭静，包振强 (1．扬州工业职业技术学院电子信息工程系，江苏扬州225009； 2．扬州大学信息工程学院，江苏扬州225009) (wangchao@ypi．edu．Cg1) 摘要：在制造业系统中车间调度是一项关键技术，可以用强化学习中的Q学习实现对车间作业的动态调度。传统的Q学习存在收敛速度慢和容易导致局部收敛的矛盾，为此提出一种改进的Q学习算法。在行为动作上提出了一种双层动作合成的动作组，给出常规数学中“聚度”概念来衡量在某一状态动作组选择的均匀程度，达到既能加速收敛又能防止局部收敛的目的

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

改进的Q学习算法在作业车间调度中的应用.pdfVIP

改进的Q学习算法在作业车间调度中的应用.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档