动态最优.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
动态最优

动态最优 1.动态最优化的性质 1.1动态最优化问题的显著特征 离散时间例子(图1.1) 连续变量情形(图1.2) 动态最优化问题的基本要素: 一个给定的初始点和终结点 从初始点到终结点的允许路径 充当表现指标的一组时间路径 特定目标—最大或最小化路径值 1.2 目标泛函 泛函的概念 与通常函数中从实数到实数的映射不同,泛函反映路径与路径值之间的关系,是时间到实数(指标)的映射。该映射一般记作V[y(t)]。 目标泛函 最优路径是路径值V[y]的极大或极小化。任一路径都包含一个个时间区间,路径值是一个和。对离散时间情形,路径值是其成分弧的值 的和,对连续时间,和是一个定积: 表示弧值需要3种信息:1、开始阶段(时间);2、开始状态;3、弧的行进方向(斜率),三者分别由 t, y(t) 和 y’(t) 表示。弧值的一般表达式是F[t, Y(t), y’(t)]。路径值泛函—弧值之和—通常写作 一个宏观经济学例子 假定效用完全来自于消费,社会目标是最大化时期 [0,T] 的效用总和,其目标泛函可以表示为 1.3 动态最优化的处理方法 处理动态最优化问题主要有3种方法:古典变分法、动态规划和最优控制理论。 支撑变分法的基本方法类似于微积分的基本方法。主要差别在于,现在处理的是影响泛函值V[y]的整条曲线 y(t) 的变分,而不是改变y=f(x)值的微分dx。 动态规划将给定的控制问题嵌入一簇控制问题中,结果,在求解给定问题过程中,实际求解了整簇控制问题。该方法将注意力集中在泛涵的最优值 上,而不是最优状态路径 。 一个最优值函数被用作解的一个特征,它给这 簇问题中的每个单个问题赋予一个最优值。嵌入过程导致求解原始问题的系统迭代程序的进行。迭代求解过程为贝尔曼最优性原理所揭示:如果你从最优的弧序列中砍掉第一段弧,剩下的序列就其自身而言仍然是最优的。 最优控制理论是变分法的进一步发展。它在动态最优化问题中考虑一个控制变量,将注意力集中于控制变量,通过运动方程将控制变量与状态变量相连。 2. 变分法 2.1 变分法的基本问题 变分法的任务是从一组允许路径 y中选取产生极值V[y]的路径。产生V[y]极值的路径 y称为极值曲线。 2.2 欧拉方程 变分法中最基本的一阶条件是欧拉方程。可令 为极值曲线来寻找构成该极值曲线的条件。考虑一组邻近路径(图2.1 ),它们穿过端点(0, A)和(T, Z)。可使用扰动曲线来产生这组路径,令该扰动路径是光滑的并穿过0点和T点,使 p(0)=p(T)=0 (2.2) 通过将 ,可以扰动 ,其中 是一个很小的数。邻近曲线为 其特性是,当 。 为给定曲线。这意味着每一 将确定一条特定邻近路径 y(t),从而确定V[y]的一个特定值。结果,不是将V 视为y的泛函,而是将它看作 的函数 ,从而可以将古典微积分应用于函数 。已知曲线 — 对应于 — 产生一个极值,因此必然有 (2.4)描述了该极值曲线特征。 (2.4)使用了任意变量 和任意扰动曲线 p(t),是不可运算的。欧拉方程将这一必要条件表述为一种通常运算形式。 通过推导可知极值曲线的必要条件可表示为 或 上式对 t 积分后成为 (2.6)式中, 的全导数。 3. 最优控制理论 在最优控制理论中,除了时间变量和状态变量外,还要考虑一个控制变量。联系状态变量和控制变量的方程为: 与变分法问题相对应,最优控制问题可写作: 在经济分析中,常用 k 表示状态变量,c表示控制变量,并加上横截性条件。典型问题为 以增长模型为例。这时 是依赖于消费水平并被时间偏好因子贴现的即期效用函数: 并不依赖于资本存量k(t),而是通过贴现因 子直接依赖于时间。约束描述了k的积累。如将k(t)看作资本,则约束为: 根据非线性最优化问题的静态解法(库恩—塔克条件),可对上述问题构造一个拉格朗日函数: 利用分部积分法可将(3.4)式写作: (3.5)式中第一项积分符号内的表达式称“汉密尔顿函数”,即 设定最优路径,给最优路径一个扰动,对控制变量而言的

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档