基于约束MORKOV的强化学习的研究与应用研究.pdfVIP

下载本文档

9
0
约1.48万字
约 4页
2018-01-12 发布于广东
举报

基于约束MORKOV的强化学习的研究与应用研究.pdf

第36卷第4B期计算机科学 V01．36No．4B Science 2009年4月 Computer Apr．2009 基于约束MORKOV的强化学习的研究与应用赵小虎王晴晴赵可可 (中国矿业大学信电学院徐州221008) 摘要对Markov决策过程与强化学习进行了研究。针对许多实际问题不仅要求报酬达到最大，同时希望代价(即费用)不要过大的特点，引入约束Markov决策过程，提出一种新的基于约束Markov决策的Q学习算法。针对煤炭行业生产与安全密切相关的特点，根据具体煤矿工作面采煤机运行控制进行了实验分析，结果证明了方法的有效性。关键词约束，Markov决策过程，强化学习，Qle枷ng，费用，煤矿 Res翰rch粕d Reinforcem饥tBasedonConstraintMarkov

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于约束MORKOV的强化学习的研究与应用研究.pdfVIP

基于约束MORKOV的强化学习的研究与应用研究.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档