- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第17届IFAC系统识别大会预印本国际会议2015年10月
19‑21日。
具有时间不一致性的时间离散随机线性二次最优控制
∗∗∗∗∗∗
倪元华
∗应用数学系,理工大学,(电子邮件:
malixun@polyu.edu.hk)
∗∗数学系,工业大学,;系统与控制重点,
数学与系统科学,,,(电子邮件:
yhni@amss.ac.cn)。
∗∗∗系统与控制重点,数学与系统科学,,中
国,(电子邮件:jif@iss.ac.cn)
:本文研究了离散时间时间不一致随机线性二次最优控制的时间一致解。与现有文献不同,
代价泛函的状态权重矩阵和控制权重矩阵未施加定号约束。得到了开环时间一致均衡控制存在
的充要条件,这些条件包括某些前向‑后向随机差分方程系统的可解性、平稳条件以及凸性条件。
在附加条件下,通过某些广义差分Riccati方程系统的解刻画了开环均衡控制的闭式解。有趣
的是,该广义差分Riccati方程系统并不具有对称结构。最后,对于所考虑问题的一个特殊情
况,所有初始对的开环均衡控制的存在性被证明等价于某个特定广义差分Riccati方程的可解
性。
:时间不一致性,随机线性二次最优控制,前向‑后向随机差分方程
1.引言一个典型的例子是所谓的消费‑储蓄决策问题,其中涉及
拟几何折现问题Krusell(2003)。上,时间不一致性
Bellman最优性原理是Bellman动态规划原理中的一个
的数学表述最早由斯特罗茨(1955),而其定性分
关键结果,其含义是:对于给定的初始对,一个最优控制
析可以追溯到(1976)的研究。在斯特罗茨(
沿着最优轨迹仍然保持最优性。这是经典随机最优控制问
1955),Goldan(1980)、帕拉西奥斯(2003)、莱
题的一个重要性质,也被称为最优控制的时间一致性。在
布森(1997)和克(2003)的研究针对离散动态
现实中,最优控制问题的时间一致性常常不成立。一方面,
系统或简单的常微分方程(ODEs),涉及非指数折现。
外部环境在变化,因此受控系统必须根据新的初始对进行
尽管上述动态优化中时间不一致性的现象主要由经济学领
调整;另一方面,人们的决策目标和偏好在变化,这导致
域的研究人员进行研究,但这类最优控制问题也逐渐引起
代价泛函随着初始对而改变。由于这些变化,所考虑的最
控制领域学者的关注。,埃克兰(2008)和
优控制问题不再具有时间一致性。
Ekland(2007)研究了简单常微分方程和随机微分方程
(SDEs)中的非指数折现问题,并引入了时间一致控制
受控系统和代价泛函中各项对初始对
原创力文档


文档评论(0)