网站大量收购独家精品文档,联系QQ:2885784924

马尔可夫决策过程复杂性的熵测度.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
马尔可夫决策过程复杂性的熵测度

第 19 卷 第 9 期  控 制 与 决 策 2004 年 9 月 V o l. 19 N o. 9  Con trol and D ec is ion   Sep t. 2004   文章编号: 100 10920 (2004) 马尔可夫决策过程复杂性的熵测度 王红卫, 李 琛, 刘会新 (华中科技大学 系统工程研究所, 湖北 武汉 430074) 摘 要: 应用 Sh annon 熵和其他熵指数来度量马尔可夫决策的复杂性 将马尔可夫链的复杂性、不确定性和不可预 测性的度量扩展到马尔可夫决策, 提出一套基于信息理论的复杂性度量方法, 可用于随机和确定性策略下的完全观 测和不完全观测马尔可夫决策. 对有关数值进行仿真研究, 并给出了计算结果. 关键词: 马尔可夫决策过程; 复杂性; 熵测度 中图分类号: T P 14    文献标识码: A En trop ic m ea surem en ts of com plex ity f or M arkov dec ision processes , , W A N G H ong w e i L I Ch en L I U H u i x in ( In st itu te o f Sy stem s Eng in eer ing, H u azhong U n iver sity o f Scien ce an d T echno logy, W uh an 430074, Ch in a. : , : @ . ) Co r re spon den t W AN G H ong w ei E m a il w anghw lw y sin a com : ′ . Abstract Sh annon s en t rop y is app lied to m ea su re th e com p lex ity o f M arkov decision p roce sse s T h e m ea su rem en t s o f th e com p lex ity , un cer ta in ty an d unp red ictab ility fo r M arkov ch a in s are ex ten ded to th e m ea su rem en t s fo r M arkov . , decision p roce sse s A m ethod o f com p lex ity m ea su rem en t s b a sed on in fo rm at ion th eo ry is deve lop ed an d it can b e . u sed fo r fu lly an d p ar t ia

您可能关注的文档

文档评论(0)

ailuojue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档