动态最优化控制.ppt

下载文档 降价啦

92
0
约3.11万字
约 110页
2018-05-02 发布于湖北
举报
版权申诉
保障服务

动态最优化控制.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

动态最优化控制

第五章最优控制模型经济行为人决策的典型特征经济活动的行为主体主要有家庭、企业和政府。家庭在做决策时，既要考虑今天，也要考虑明天，既要考虑当代，还要考虑下一代；企业在做决策时，不仅要考虑当期的收益，也要考虑未来的持续经营；政府在做决策时，不仅要考虑当前，也要考虑未来。总之，经济行为人的决策是一个跨期优化(intertemporal optimazation)问题。处理跨期优化问题的方法 (1) 最优控制(optimal control) (2) 变分法(calculus of variations) (3) 动态规划(dynamic programming) 一、离散跨期选择问题 1、离散跨期选择的经典问题——“Cake-eating”问题假设行为人拥有一些不可再生的资源，如一块蛋糕，该资源的初始存量为S0，行为人在时期t的消费量为ct，则在时期t资源的存量为： St=St-1-ct 再假设行为人确切地知道他能活3个时期，如青年、中年、老年三个时期，问题是该行为人如何将其资源在各个时期中消费？ 2、“Cake-eating”问题的数学表述记行为人的效用函数为u(ct)，该效用函数在各个时期均相同，且有： u′(c)0，u′′(c)0，u′(0)=? 再记未来效用的折现率为ρ，行为人追求一生当中效用的现值的最大化，则该行为人的消费决策问题就可表示为：式中St称为状态变量，ct称为控制变量。 3、“Cake-eating”问题的求解假设行为人并没有留有遗产的动机，则有： S3=0，c3=S2，c2+c3=S1，c1+c2+c3=S0 使用拉格朗日乘子法，得： Max L=u(c1)+u(c2)/(1+ρ)+u(c3)/(1+ρ)2+λ(S0-c1-c2-c3) 使L最大化的一阶条件为： ?L/?c1=u′(c1)-λ=0 ?L/?c2=u′(c2)/(1+ρ)-λ=0 ?L/?c3=u′(c3)/(1+ρ)2-λ=0 即有： u′(c1)=u′(c2)/(1+ρ)=u′(c3)/(1+ρ)2 3、“Cake-eating”问题的求解由式u′(c1)=u′(c2)/(1+ρ)=u′(c3)/(1+ρ)2，可知：如果折现率?=0，则有： u′(c1)=u′(c2)=u′(c3) 即： c1=c2=c3 如果折现率?0，则有： u′(c1)u′(c2)u′(c3) 即： c1c2c3 如果确切知道?和S0的值，则可具体求出c1、c2和c3。二、连续时间的最优控制基本概念 1、跨期效用函数所谓跨期效用函数，即行为人一生的总效用函数，如“Cake-eating”问题中的效用函数： U(c1,c2,c3)=u(c1)+u(c2)/(1+ρ)+u(c3)/(1+ρ)2 其中，每个时期的效用函数u(ct)称为“幸福” (felicity) 函数。对于连续时间的情形，跨期效用函数通常写为： U(ct)=t0?Tu(ct)e-ρtdt 其中每时刻的效用函数u(ct)又称为瞬时效用函数，或“幸福”函数。连续时间的最优控制 1、跨期效用函数如此设定的跨期效用函数具有可加性(additivity)或称可分离性(separability)的性质。可分离性的条件为： ?Mij/?ck=0 其中Mij为不同时期消费的边际替代率(marginal rate of substitution between consumption in period i and j)，即： Mij=Ui(.)/Uj(.)=(?U/?ci)/(?U/?cj) 连续时间的最优控制 2、指数折现率在跨期效用函数中，通常需要有折现因子。一般地，折现因子可表示为α(t)。在连续时间的跨期效用函数中，折现因子一般设定为指数形式，即有： α(t)=e-ρt 设定指数折现形式的