基于约束MORKOV的强化学习的研究与应用研究.pdfVIP

  • 9
  • 0
  • 约1.48万字
  • 约 4页
  • 2018-01-12 发布于广东
  • 举报

基于约束MORKOV的强化学习的研究与应用研究.pdf

第36卷第4B期 计算机科学 V01.36No.4B Science 2009年4月 Computer Apr.2009 基于约束MORKOV的强化学习的研究与应用 赵小虎王晴晴赵可可 (中国矿业大学信电学院徐州221008) 摘要对Markov决策过程与强化学习进行了研究。针对许多实际问题不仅要求报酬达到最大,同时希望代价(即 费用)不要过大的特点,引入约束Markov决策过程,提出一种新的基于约束Markov决策的Q学习算法。针对煤炭 行业生产与安全密切相关的特点,根据具体煤矿工作面采煤机运行控制进行了实验分析,结果证明了方法的有效性。 关键词约束,Markov决策过程,强化学习,Qle枷ng,费用,煤矿 Res翰rch粕d Reinforcem饥tBasedonConstraintMarkov

文档评论(0)

1亿VIP精品文档

相关文档