参数Markov决策过程的随机逼近算法-云南大学.PDFVIP

下载本文档

2
0
约2.34万字
约 4页
2019-04-06 发布于天津
举报

参数Markov决策过程的随机逼近算法-云南大学.PDF

下载本文档
关闭预览

下载本文档
收藏
分享赚钱奖
0

文本预览
常见问题

( ) , 2003, 25 (5) : 377~ 380 CN 53- 1045/ N ISSN 0258- 7971 Journal of Yunnan Uni ersity Marko 胡光华 ( , 65009 1) : , , . , 1 . : M arkov ; ; : O 211. 5 : A : 0258- 7971( 2003) 05- 0377- 04 ( MDP) i ∀ S, ( i) = 1 S [ 0, 1] M a . 3 a∀ A K , ∀ R , , , {f ( i, ) : a ∀ A , i ∀ S} , i Watkin [ 1] Q- William [ 2] a a ; f ( i, ) [ 3] a , ( i, ) = , a [ 4] f a∋( i, ) - . a∋∀ A 2 . MDP , MDP ; p ( ) = * i, )p ( a), ji a ij a∀ A [ 3] . r( i, ) = ( i, ) r( i, a). a 1 . a∀ A K Q = {P ( ): ∀ R }, Q Q , 1 . : S = { 1, 2, !, N } 1 P ∀ Q {X , t = 0, 1, 2, !} . t . K K

您可能关注的文档

分形彩色图像压缩中的相似变换及其压缩算法-福州大学学报.PDF
分布式系统模型SystemModels.PPT
分部分项工程和单价措施项目清单与计价表分部分项工程和单价措施.PDF
分裂与修复理论之后的文学与情感-广州大学学报.PDF
创业基础主题一创业基本认知-corvairguynjcom.PPT
创伤性脊髓损伤的重症监护治疗进展-中华危重病急救医学.PDF
创建轮廓曲线.PPT
创新日本2018大学博览会大学等分野的展示采用课题Web公开.PDF
创新国际化人才成长路径.PDF
初一级部学生寒假作业公告.DOC

参数回归模型的最大加权似然估计及其性质-福州大学学报.PDF
参考文献管理工具.PDF
双光路光散射法在线测量粉尘浓度的试验研究-东南大学学报.PDF
参麦合剂对兔干眼症模型泪液分泌及眼表结构的影响-世界中医药.PDF
双束半腱肌肌腱解剖重建内侧髌股韧带治疗复发性髌骨脱位-中医正骨.PDF
双联抗血小板治疗合并上消化道出血的危险因素.PDF
原发性宫颈及阴道恶性黑色素瘤51例的临床分析-中国癌症杂志.PDF
反向微创内固定系统与股骨近端防旋髓内钉修复-中国组织工程研究.PDF
反流性食管炎的中医研究进展-中医药通报.PDF
双黄花颗粒镇咳祛痰及免疫作用研究-天津中草药杂志社.PDF

文档评论（0）

1亿VIP精品文档

更多 >

参数Markov决策过程的随机逼近算法-云南大学.PDFVIP