补充数学.pptVIP

下载本文档

15
0
约4.04千字
约 17页
2016-04-02 发布于湖北
举报
版权申诉

补充数学.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

补充数学.ppt

2 连续时间的最优控制 2.1 基本概念 1、跨期效用函数所谓跨期效用函数，即行为人一生的总效用函数，如“吃糕”问题中的效用函数： U(c1,c2,c3)=u(c1)+u(c2)/(1+ρ)+u(c3)/(1+ρ)2 其中，每个时期的效用函数u(ct)称为“幸福” (felicity) 函数。对于连续时间的情形，跨期效用函数通常写为： U(ct)=t0?Tu(ct)e-ρtdt 其中每时刻的效用函数u(ct)又称为瞬时效用函数，或“幸福”函数。 2 连续时间的最优控制 6、拉格朗日函数最简单的最优控制问题可以写为： J(s,t)=Max t0?Tf(s,c,t)dt s.t : ?(t)=g(s,c,t) s(t0)=s(0)=s0，s(T)自由由于在区间[t0,T]上，状态变量的运动方程?(t)=g(s,c,t)始终成立，从而始终有[g(s,c,t)-?]=0。使用拉格朗日乘子的概念，则有： ψ(t)[g(s,c,t)-?]=0 也必然有： t0?Tψ(t)[g(s,c,t)-?]dt=0 6、拉格朗日函数因此，将此式0?Tψ(t)[g(s,c,t)-?]dt加入目标函数之中，并不影响目标函数的值，于是可将目标函数扩展为： L= t0?Tf(s,c,t)dt+t0?Tψ(t)[g(s,c,t)-?]dt = t0?T{f(s,c,t)+ψ(t)[g(s,c,t)-?(t)]}dt 对于此式中的最后一部分使用分部积分，则有： -t0?Tψ(t)?(t)dt=-ψ(t)s(t)|0T+t0?Ts(t)ψ?(t)dt =-ψ(T)s(T)+ψ(t0)s(t0)+t0?Ts(t)ψ?(t)dt 代入前式，得拉格朗日函数为： L=t0?T[f(s,c,t)+ψg(s,c,t)+sψ?]dt-ψ(T)s(T)+ψ(t0)s(t0) 7、一阶条件为了导出最优控制问题的一阶条件，假设已得到了拉格朗日函数的最大值L，则拉格朗日函数中变量的任何变化都会引起L值的下降。也就是说，在最优点，将L对c和s微分，必然有dL?0，即有： dL=t0?T[fc+ψgc)dc+(fs+ψgs+ψ?)ds]dt -ψ(T)ds(T)+ψ(t0)ds(t0)?0 要使dL?0成立，上式中的每一项都必须小于或等于0。由于dc和ds均可正可负，所以必须有： fc+ψgc=0 fs+ψgs+ψ?=0 此二必要条件就称为最优控制问题的一阶条件。 2 连续时间的最优控制 8、横截条件在最优控制问题中，如果状态变量的初始值s(t0)和终点值s(T)都已给定，则ds(t0)和ds(T)都为0。如果仅初始值s(t0)给定，而终点值s(T)没有给定，则要使dL中的ψ(T)ds(T)?0，就必须有： ψ(T)=0 这也称为固定时限的自由终值问题的横截条件。该条件表明，对于可以自由选择终点值的最优控制问题，终点时刻的拉格朗日乘子值必须为0。 2 连续时间的最优控制 9、共态变量在最优控制问题的拉格朗日函数中，拉格朗日乘子ψ(t)是伴随着状态变量而引进的，称为共态变量(costate variables)。由拉格朗日函数可得： ?L/?s0= ψ(t0) ?L/?sT= -ψ(T) 这表明，状态变量的初始值每增加一个单位，就可使优化目标函数值增加ψ(t0)个单位；而状态变量的终点值每增加一个单位，则可使优化目标函数值减少ψ(T)个单位。因此，共态变量ψ(t)用目标函数的度量单位计量了状态变量s(t)的价值，可称为状态变量的影子价格(shadow price)。 2 连续时间的最优控制 10、汉密尔顿(Hamilton)函数在最优控制问题的拉格朗日函数中，与控制变量c(t)有关的只有其前两项，因此可单独列出此两项为：