- 9
- 0
- 约1.48万字
- 约 4页
- 2018-01-12 发布于广东
- 举报
第36卷第4B期 计算机科学 V01.36No.4B
Science
2009年4月 Computer Apr.2009
基于约束MORKOV的强化学习的研究与应用
赵小虎王晴晴赵可可
(中国矿业大学信电学院徐州221008)
摘要对Markov决策过程与强化学习进行了研究。针对许多实际问题不仅要求报酬达到最大,同时希望代价(即
费用)不要过大的特点,引入约束Markov决策过程,提出一种新的基于约束Markov决策的Q学习算法。针对煤炭
行业生产与安全密切相关的特点,根据具体煤矿工作面采煤机运行控制进行了实验分析,结果证明了方法的有效性。
关键词约束,Markov决策过程,强化学习,Qle枷ng,费用,煤矿
Res翰rch粕d Reinforcem饥tBasedonConstraintMarkov
您可能关注的文档
- 基于网格的远程协同故障诊断资源管理模型研讨.pdf
- 基于网格的织物图像拼接技术研究.pdf
- 基于网格服务的电子交易体系与交易流程分析研究.pdf
- 基于网格服务的工作流系统模型研讨.pdf
- 基于网格服务的森工企业应急知识管理体系构建研究.pdf
- 基于累积帧的自适应镜头边界检测算法研究.pdf
- 基于网格和密度的聚类神经网络结构优化研究.pdf
- 基于纳米TiO2的化学发光法检测核黄素研究.pdf
- 基于纳米功能粉体的高性能无机有机复合涂层材料的开发研究.pdf
- 基于纳米光催化的旅客机新型座舱空气质量控制系统研究.pdf
- 东亚危机中金融传染的研究.docx
- 2026湖南湘江研究院有限责任公司招聘7人备考题库含答案详解(a卷).docx
- 三级公立中医医院关于出院病员欠费情况审计报告.docx
- 三级调研员屈全胜个人简历.docx
- 2026湖南湘江研究院有限责任公司招聘7人备考题库附答案详解(综合卷).docx
- 2026湖南湘江研究院有限责任公司招聘7人备考题库含答案详解(精练).docx
- 2026湖南省交通科学研究院有限公司招聘37人备考题库有完整答案详解.docx
- 三晖电气三季度财务分析报告银行版.docx
- 2026湖南湘江研究院有限责任公司招聘7人备考题库及答案详解(全优).docx
- 2026玉溪硅基智能科技有限公司招聘10人备考题库及参考答案详解一套.docx
最近下载
- 小学数学五年级解方程专项练习题(整数)(每日一练,共11份).pdf VIP
- DY_T 8-2023 数字电影LED影厅技术要求和测量方法.pdf VIP
- 26年东明社区招聘考题真题及答案.doc VIP
- 2015年国际商务单证员(单证操作与缮制)真题试卷(题后含答案及解析).pdf VIP
- 小学数学五年级解方程专项练习题(整数)(每日一练,共21份).pdf VIP
- 2026个人及班子学习教育主要问题清单及整改措施材料(四个方面)共2篇.docx VIP
- 五年级数学(下)期中测试题1.doc VIP
- GB 50300-2013建筑工程施工质量验收统一标准.pdf VIP
- 1-微型消防站器材点检表.doc VIP
- 碳酸盐岩储层沉积学特征.ppt VIP
原创力文档

文档评论(0)