- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
动态最优化控制
第五章 最优控制模型 经济行为人决策的典型特征 经济活动的行为主体主要有家庭、企业和政府。家庭在做决策时,既要考虑今天,也要考虑明天,既要考虑当代,还要考虑下一代;企业在做决策时,不仅要考虑当期的收益,也要考虑未来的持续经营;政府在做决策时,不仅要考虑当前,也要考虑未来。总之,经济行为人的决策是一个跨期优化(intertemporal optimazation)问题。 处理跨期优化问题的方法 (1) 最优控制(optimal control) (2) 变分法(calculus of variations) (3) 动态规划(dynamic programming) 一、 离散跨期选择问题 1、离散跨期选择的经典问题——“Cake-eating”问题 假设行为人拥有一些不可再生的资源,如一块蛋糕,该资源的初始存量为S0,行为人在时期t的消费量为ct,则在时期t资源的存量为: St=St-1-ct 再假设行为人确切地知道他能活3个时期,如青年、中年、老年三个时期,问题是该行为人如何将其资源在各个时期中消费? 2、“Cake-eating”问题的数学表述 记行为人的效用函数为u(ct),该效用函数在各个时期均相同,且有: u′(c)0,u′′(c)0,u′(0)=? 再记未来效用的折现率为ρ,行为人追求一生当中效用的现值的最大化,则该行为人的消费决策问题就可表示为: 式中St称为状态变量,ct称为控制变量。 3、“Cake-eating”问题的求解 假设行为人并没有留有遗产的动机,则有: S3=0,c3=S2,c2+c3=S1,c1+c2+c3=S0 使用拉格朗日乘子法,得: Max L=u(c1)+u(c2)/(1+ρ)+u(c3)/(1+ρ)2+λ(S0-c1-c2-c3) 使L最大化的一阶条件为: ?L/?c1=u′(c1)-λ=0 ?L/?c2=u′(c2)/(1+ρ)-λ=0 ?L/?c3=u′(c3)/(1+ρ)2-λ=0 即有: u′(c1)=u′(c2)/(1+ρ)=u′(c3)/(1+ρ)2 3、“Cake-eating”问题的求解 由式u′(c1)=u′(c2)/(1+ρ)=u′(c3)/(1+ρ)2,可知: 如果折现率?=0,则有: u′(c1)=u′(c2)=u′(c3) 即: c1=c2=c3 如果折现率?0,则有: u′(c1)u′(c2)u′(c3) 即: c1c2c3 如果确切知道?和S0的值,则可具体求出c1、c2和c3。 二、 连续时间的最优控制 基本概念 1、跨期效用函数 所谓跨期效用函数,即行为人一生的总效用函数,如“Cake-eating”问题中的效用函数: U(c1,c2,c3)=u(c1)+u(c2)/(1+ρ)+u(c3)/(1+ρ)2 其中,每个时期的效用函数u(ct)称为“幸福” (felicity) 函数。 对于连续时间的情形,跨期效用函数通常写为: U(ct)=t0?Tu(ct)e-ρtdt 其中每时刻的效用函数u(ct)又称为瞬时效用函数,或“幸福”函数。 连续时间的最优控制 1、跨期效用函数 如此设定的跨期效用函数具有可加性(additivity)或称可分离性(separability)的性质。 可分离性的条件为: ?Mij/?ck=0 其中Mij为不同时期消费的边际替代率(marginal rate of substitution between consumption in period i and j),即: Mij=Ui(.)/Uj(.)=(?U/?ci)/(?U/?cj) 连续时间的最优控制 2、指数折现率 在跨期效用函数中,通常需要有折现因子。一般地,折现因子可表示为α(t)。在连续时间的跨期效用函数中,折现因子一般设定为指数形式,即有: α(t)=e-ρt 设定指数折现形式的
文档评论(0)