强化学习系统及其基于可靠度最优的学习算法.PDFVIP

下载本文档

3
0
约1.99万字
约 8页
2019-03-17 发布于天津
举报

强化学习系统及其基于可靠度最优的学习算法.PDF

下载本文档
关闭预览

下载本文档
收藏
分享赚钱奖
0

文本预览
常见问题

265 Vol.26,No.5 1997 10 Information and Control Oct ., 1997 0 俞星星　阎平凡 ( 100084) , , ., . , J- -. a , , 1 ( einforcement Learning) , : , . , , , [2] . [3] 1 . 1 . ,, , 1 (Immediate einforcement) (Associative einforcement Learning) , . ., ,. , (T emporal Credit Assignment) (Structural Credit Assignment) . (TD:T emporal Difference Method) [4, 5] , . Sutton TD , . [6] , ( - ) - Q Q Learning [7] ( - ) ., Actor Critic Learning , 2. [3] [ 810] .[ 11] DYNA-Q ;[ 12] , BP ;[ 13] - a 1996- 09- 18 0 ( ) 5 : 333 , ;[ 14] , ( ] , ,, . [ 15] , ( ] ( ] . ;

您可能关注的文档

实验四放线菌.doc
对盗窃犯、顽危犯.ppt
常州大学高等职业教育研究院项目评审书.doc
广州城建职业学院创业教育学院高职教育质量2019年度报告.PDF
建构友善校园的雏形(ppt简报)-罗东高中.ppt
弥陀不思议美感新教育-教育脉动-国家教育研究院.PDF
彰化县南州国民小学.doc
循环流化床锅炉(CFB)热力计算软件简介.PDF
微立体求职竞职-动画-中国科学院附属玉泉小学.ppt
急救气管插管预防颅脑外伤昏迷患者吸人性肺炎的对照研究-中国急救医学.PDF

统编版2025年春季新版七年级下册历史第21课明清时期的科技与文化教案.docx
雅安雨城法院书记员招聘考试真题库2025.docx
2026届安徽合肥市高考一模高考语文试卷试题（含答案详解）.pdf
【专题研究】国内外城市更新研究的最新进展.pdf
【专题研究】老旧城区改造居民满意度影响因素研究——以遂宁市老旧城区改造为例.pdf
【专题研究】关于旧城空间改造理论与创意设计案例的几点思考.pdf
西藏拉萨市高三下学期期末物理备考重点详解.docx
泾县法院书记员招聘笔试真题2025.pdf
2026年春【苏教版】-六年级数学下册-面积的变化.pptx
2026年春【苏教版】-六年级数学下册-7.pptx

文档评论（0）

1亿VIP精品文档

更多 >

强化学习系统及其基于可靠度最优的学习算法.PDFVIP