- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
补充数学.ppt
2 连续时间的最优控制 2.1 基本概念 1、跨期效用函数 所谓跨期效用函数,即行为人一生的总效用函数,如“吃糕”问题中的效用函数: U(c1,c2,c3)=u(c1)+u(c2)/(1+ρ)+u(c3)/(1+ρ)2 其中,每个时期的效用函数u(ct)称为“幸福” (felicity) 函数。 对于连续时间的情形,跨期效用函数通常写为: U(ct)=t0?Tu(ct)e-ρtdt 其中每时刻的效用函数u(ct)又称为瞬时效用函数,或“幸福”函数。 2 连续时间的最优控制 6、拉格朗日函数 最简单的最优控制问题可以写为: J(s,t)=Max t0?Tf(s,c,t)dt s.t : ?(t)=g(s,c,t) s(t0)=s(0)=s0,s(T)自由 由于在区间[t0,T]上,状态变量的运动方程?(t)=g(s,c,t)始终成立,从而始终有[g(s,c,t)-?]=0。使用拉格朗日乘子的概念,则有: ψ(t)[g(s,c,t)-?]=0 也必然有: t0?Tψ(t)[g(s,c,t)-?]dt=0 6、拉格朗日函数 因此,将此式0?Tψ(t)[g(s,c,t)-?]dt加入目标函数之中,并不影响目标函数的值,于是可将目标函数扩展为: L= t0?Tf(s,c,t)dt+t0?Tψ(t)[g(s,c,t)-?]dt = t0?T{f(s,c,t)+ψ(t)[g(s,c,t)-?(t)]}dt 对于此式中的最后一部分使用分部积分,则有: -t0?Tψ(t)?(t)dt=-ψ(t)s(t)|0T+t0?Ts(t)ψ?(t)dt =-ψ(T)s(T)+ψ(t0)s(t0)+t0?Ts(t)ψ?(t)dt 代入前式,得拉格朗日函数为: L=t0?T[f(s,c,t)+ψg(s,c,t)+sψ?]dt-ψ(T)s(T)+ψ(t0)s(t0) 7、一阶条件 为了导出最优控制问题的一阶条件,假设已得到了拉格朗日函数的最大值L,则拉格朗日函数中变量的任何变化都会引起L值的下降。也就是说,在最优点,将L对c和s微分,必然有dL?0,即有: dL=t0?T[fc+ψgc)dc+(fs+ψgs+ψ?)ds]dt -ψ(T)ds(T)+ψ(t0)ds(t0)?0 要使dL?0成立,上式中的每一项都必须小于或等于0。由于dc和ds均可正可负,所以必须有: fc+ψgc=0 fs+ψgs+ψ?=0 此二必要条件就称为最优控制问题的一阶条件。 2 连续时间的最优控制 8、横截条件 在最优控制问题中,如果状态变量的初始值s(t0)和终点值s(T)都已给定,则ds(t0)和ds(T)都为0。如果仅初始值s(t0)给定,而终点值s(T)没有给定,则要使dL中的ψ(T)ds(T)?0,就必须有: ψ(T)=0 这也称为固定时限的自由终值问题的横截条件。该条件表明,对于可以自由选择终点值的最优控制问题,终点时刻的拉格朗日乘子值必须为0。 2 连续时间的最优控制 9、共态变量 在最优控制问题的拉格朗日函数中,拉格朗日乘子ψ(t)是伴随着状态变量而引进的,称为共态变量(costate variables)。由拉格朗日函数可得: ?L/?s0= ψ(t0) ?L/?sT= -ψ(T) 这表明,状态变量的初始值每增加一个单位,就可使优化目标函数值增加ψ(t0)个单位;而状态变量的终点值每增加一个单位,则可使优化目标函数值减少ψ(T)个单位。因此,共态变量ψ(t)用目标函数的度量单位计量了状态变量s(t)的价值,可称为状态变量的影子价格(shadow price)。 2 连续时间的最优控制 10、汉密尔顿(Hamilton)函数 在最优控制问题的拉格朗日函数中,与控制变量c(t)有关的只有其前两项,因此可单独列出此两项为:
原创力文档


文档评论(0)