动态最优.pptVIP

下载本文档

22
0
约2.48千字
约 22页
2018-06-21 发布于河南
举报
版权申诉

动态最优.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

动态最优

动态最优 1.动态最优化的性质 1.1动态最优化问题的显著特征离散时间例子（图1.1）连续变量情形（图1.2）动态最优化问题的基本要素：一个给定的初始点和终结点从初始点到终结点的允许路径充当表现指标的一组时间路径特定目标—最大或最小化路径值 1.2 目标泛函泛函的概念与通常函数中从实数到实数的映射不同，泛函反映路径与路径值之间的关系，是时间到实数（指标）的映射。该映射一般记作V[y(t)]。目标泛函最优路径是路径值V[y]的极大或极小化。任一路径都包含一个个时间区间，路径值是一个和。对离散时间情形，路径值是其成分弧的值的和，对连续时间，和是一个定积：表示弧值需要3种信息：1、开始阶段（时间）；2、开始状态；3、弧的行进方向（斜率），三者分别由 t, y(t) 和 y’(t) 表示。弧值的一般表达式是F[t, Y(t), y’(t)]。路径值泛函—弧值之和—通常写作一个宏观经济学例子假定效用完全来自于消费，社会目标是最大化时期 [0，T] 的效用总和，其目标泛函可以表示为 1.3 动态最优化的处理方法处理动态最优化问题主要有3种方法：古典变分法、动态规划和最优控制理论。支撑变分法的基本方法类似于微积分的基本方法。主要差别在于，现在处理的是影响泛函值V[y]的整条曲线 y(t) 的变分，而不是改变y=f(x)值的微分dx。动态规划将给定的控制问题嵌入一簇控制问题中，结果，在求解给定问题过程中，实际求解了整簇控制问题。该方法将注意力集中在泛涵的最优值上，而不是最优状态路径。一个最优值函数被用作解的一个特征，它给这簇问题中的每个单个问题赋予一个最优值。嵌入过程导致求解原始问题的系统迭代程序的进行。迭代求解过程为贝尔曼最优性原理所揭示：如果你从最优的弧序列中砍掉第一段弧，剩下的序列就其自身而言仍然是最优的。最优控制理论是变分法的进一步发展。它在动态最优化问题中考虑一个控制变量，将注意力集中于控制变量，通过运动方程将控制变量与状态变量相连。 2. 变分法 2.1 变分法的基本问题变分法的任务是从一组允许路径 y中选取产生极值V[y]的路径。产生V[y]极值的路径 y称为极值曲线。 2.2 欧拉方程变分法中最基本的一阶条件是欧拉方程。可令为极值曲线来寻找构成该极值曲线的条件。考虑一组邻近路径（图2.1 ），它们穿过端点（0, A）和(T, Z)。可使用扰动曲线来产生这组路径，令该扰动路径是光滑的并穿过0点和T点，使 p(0)=p(T)=0 (2.2) 通过将，可以扰动，其中是一个很小的数。邻近曲线为其特性是，当。为给定曲线。这意味着每一将确定一条特定邻近路径 y(t)，从而确定V[y]的一个特定值。结果，不是将V 视为y的泛函，而是将它看作的函数，从而可以将古典微积分应用于函数。已知曲线 — 对应于 — 产生一个极值，因此必然有（2.4）描述了该极值曲线特征。（2.4）使用了任意变量和任意扰动曲线 p(t),是不可运算的。欧拉方程将这一必要条件表述为一种通常运算形式。通过推导可知极值曲线的必要条件可表示为或上式对 t 积分后成为 (2.6)式中，的全导数。 3. 最优控制理论在最优控制理论中，除了时间变量和状态变量外，还要考虑一个控制变量。联系状态变量和控制变量的方程为：与变分法问题相对应，最优控制问题可写作：在经济分析中，常用 k 表示状态变量，c表示控制变量，并加上横截性条件。典型问题为以增长模型为例。这时是依赖于消费水平并被时间偏好因子贴现的即期效用函数：并不依赖于资本存量k(t)，而是通过贴现因子直接依赖于时间。约束描述了k的积累。如将k(t)看作资本，则约束为: 根据非线性最优化问题的静态解法（库恩—塔克条件），可对上述问题构造一个拉格朗日函数：利用分部积分法可将（3.4）式写作：（3.5）式中第一项积分符号内的表达式称“汉密尔顿函数”，即设定最优路径，给最优路径一个扰动，对控制变量而言的