非一致有界费用MDP的强平均最优性条件.pdfVIP

非一致有界费用MDP的强平均最优性条件.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2010年 3月 运 筹 学 学 报 第 14卷 第 1期 March,2010 0R TRANSACTIONS V01.14 No.1 非一致有界费用MDP的强平均最优性条件 肖晴初 ,t 谭杭生 摘要 研究可数状态空间任意行动空间非一致性有界费用马氏决策过程 (MDP)的强 平均最优,给出了使得每个常用的平均最优策略也是强平均最优的条件,并实质性的推广了 Cavazos—Cadena和Fernandez—Gaucheran(Math.Meth.Oper.Res.,1996,43:281—300) 的主要结果 . 关键词运筹学,马氏决策过程 (MDP),强平均费用准则,非一致有界费用,充分条件 学科分类号(GB/T13745—92)I10.74 A Condition forStrongAverageOptimality ofM DP with Non-uniform lyBounded Costs XiaoQingchu ,2’ TanHangsheng Abstract Inthispaper.weconsidertheMrakovdecisionprocessesunderanaverage costcriterion withnon.uniformly boundedcost,denumerablestateandrabitraryaction spaces.SomeSU~cientconditionsaregivenunderwhichevery averageoptimalpolicy iS strongaverageoptima1.W eimprovethemalnresultsobtalnedbyCavazoS—CadenaR.and Fernandez.GaucheranE.(Math.Meth.Oper.Res.,1996,43:281—300). KeywordsOperationsreserach,Mrakovdecisionprocesses,strongaverageoptimal· itycriterion,non.uniformlyboundedcost,SUfficientconditions SubjectClassification (GB/T1374592)110.74 1 引言及模型 马氏决策过程 (简记为MDP)平均模型是随机最优控制问题中非常重要的一类, 它在很多领域有广泛应用 [1--3】,其常用的最优性准则是平均期望费用准则 (简记为 AC)[2,4--5].不过, AC准则完全忽略了有限阶段 内费用的变化 [5-6】.因此,Ghosh 和Marcus引入了强平均期望费用准则 0【】(简记为 SAC),并给出了无界费用下 SAC最 优策略存在的条件.此后,Cavazos—Cadena和 Fernandez—Gaucheran[J在比Ghosh和 Marcus[6】更弱的Sennott[8,9]条件下,对于有界费用情形,证明了每个AC一最优策略也 是SAC一最优的,并给出了AC一最优策略不是 SAC.最优策略的无界费用的例子.然 收稿 日期: 2009年 8月 10日. 本文得到湖南省自然科学基金项目(08JJ3004),湖南省社会科学基金项目(08YBB187)的支持 1.中南大学数学科学与计算技术学院,长沙,410075;SchoolofMathematicalScienceandComputing Technology,CentralSouthUniversity,Changsha410075,China 2.湖南商学院信息学院,长沙,410205;InformationDepartmentofHunanUniversityofCommerce, Changsha410205,China t通讯作者 Corresp0ndingauthor 肖晴初,谭杭生 l4卷

文档评论(0)

lizhencai0920 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6100124015000001

1亿VIP精品文档

相关文档