宏观经济学分析方法系列(课堂放映版11硕已讲)动态规划的Bellman原理.docVIP

  • 6
  • 0
  • 约3.33千字
  • 约 11页
  • 2017-10-06 发布于重庆
  • 举报

宏观经济学分析方法系列(课堂放映版11硕已讲)动态规划的Bellman原理.doc

宏观经济学分析方法系列(课堂放映版11硕已讲)动态规划的Bellman原理

================= ================= 附录: 宏观经济学分析方法:动态规划的Bellman原理 (10、11硕已讲,精细订正版) 二、一个简化的例子 欲对Bellman原理有一个快速的理解,这里通过一个简化的例子,以勾勒出动态规划方法所特有的向后追溯(backward recursion,逆向递归,逆向归纳)的特征。 假定: (1)典型个人生存两个时期,他可以在两个时点上,即上做决策(时,他就死亡了);他被赋予一定量的初始资源。 (2)理想化的资本市场上存在两种资产。一种是无风险的现金或者债券,它的价格在任何时刻都没有变化,始终为;另一种是有风险的股票,它的价格过程假定由以下二项树描绘(参见下图)。 简单地说,它表示在每一时点上,股票价格要么以 的概率上涨一倍,要么以 的概率下跌一半。用和表示该投资者在时刻上,投资于风险资产(股票)上的财富分额。 (3)投资者的非资本收入为 ,效用函数具有以下特定形式: (4)为了简化求解,假定投资者不进行任何消费,这样最优决策的惟一目标就是最大化他来自最终财富的期望效用。 至此,最优化问题就可以简化为: 我们的任务就是找到最优的投资决策变量(最优控制)和,使以上最优化问题得以解决。 可以尝试采用“向前”推导的方法,即从 时刻开始,事先决定一个策略 ,但它是不是最优还不清楚,根据我们仅仅能够知道时刻的期望财富水平的函数表达式,但是最大化这个函数得到的“最优的”,并不一定是最优决策过程的必然组成部分,除非可以明确地知道在所有不同情况状态下的 ,并且它是惟一的。因此,向前推导的方法是行不通的。 换一种思路,我们可以试着从倒数第一期,即期开始。这就是说,我们必须获得 时期,股票价格在或者两种情况下的最优投资比例,而这是一个单期静态优化问题。一旦获得了时的相应结果和,就可以按照同样的手续,进一步推导时刻的最优投资比例,从而一层层地逐步解决问题。 具体求解如下: 第一步:时刻 假定此时的财富 为任意一正数(它是由上一期 时的最优决策所产生的)。投资到股票上的财富比例为,则投向无风险资产上的就是。我们来计算最后的时刻,积累的财富的期望效用是多少。 先考虑当股票价格时的情形,根据二项树模型: 为了找到最优投资比例 ,只要对求导,并令一阶导数于就可以了,容易得到: 和 再考察当股票价格时的情形 , 我们发现仍旧可以使用上式 。 因为 依然表示股票价格上涨一倍的情况下,投资在两种资产上,给投资者带来的期末财富的期望效用;而则是投资机会相对较差即下跌 一半时,期末财富的期望效用水平。因此最优解还是,因此这个最优投资比例决策独立于时刻股票价格和财富的绝对水平。 第二步: 时刻 根据上面的推理,我们只要知道时刻的财富水平 ,就可以知道最终财富的期望效用水平是多少,而时期的财富水平,也是由同第一步类似的决策过程所决定的, 即: 同样对 求导数,并令一阶导数等于,得到最优化条件,因此动态最优投资决策方案就是: , 尽管实际的问题要比这个简单的例子复杂得多,但从上述求解过程中,仍然可以归纳出最优个人消费(投资)决策的动态规划解法的最显著特征,即它是向后追溯的。而这正是贝尔曼最优化原理的体现。 三、一般情形 现在考察多期(多阶段)离散时间情况下,个人最优消费/投资决策问题的标准建模方法和它的一般解法。 假定: (1)有限生命 典型个人生命时期(lifetime)为,他可以在这些离散的时点上做决策;他被赋予一定量的初始资源。 (2)单一消费品 只有一种用于当期消费的易腐消费品。它不可以储藏,暂时不考虑它是如何生产出来的。 (3)资产价格运动 理想化的资本市场上存在种资产,第 种资产是无风险的债券,它的单位时间总收益率为;其他种都是风险资产,它们的总收益率定义为: 是由外部经济环境外生决定的。。 (4)资产组合 令 为投资在第种风险资产上的财富占总财富数量的相对份额,则就是投资在无风险资产上的财富份额。 因此整个资产组合的总收益率就是: (2-2) (5)令为非资本收入,如果假定这个收入来源是随机的,也可以称之为外生禀赋过程(endowment process)。注意,我们定义。 根据上述设定,可以把财富积累方程,也即约束条件表述为: (2-3) (6)非负条件 要求在任何时刻,不可以出现负的财富和消费,即 这样一来,最优化问题(2-1)式就可以表述为: (2-4) ============================= 1、这里有一个非常重要的假定,即效用函数是时间可加的(time-additive)。时间可加性是一个很强的假设,它假定多期效用函数采取如下这种形式 2、人们可能会对于没有贴现这些期望效用存在疑问,实际上加上时

文档评论(0)

1亿VIP精品文档

相关文档