第二讲最优控制原理.docVIP

下载本文档

25
0
约3.05千字
约 10页
2017-09-01 发布于重庆
举报
版权申诉

第二讲最优控制原理.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第二讲最优控制原理

第二讲最优控制原理处理动态最优化问题，采用的方法有变分法，动态规划（贝尔曼），最优控制(庞特里雅金)理论三种。问题：在整个计划期间内的每一时刻（连续情形），选择变量的最优值是什么？其解是：对于每个选择变量的一条最优时间距离。一般形式：最大化满足 V：目标函数 Y：状态变量 U：控制变量。（特征1：受制于决策者，2：可以影响状态变量）。目的：通过调节U，影响Y，再影响V，满足或者说，决策者通过选择U，在时间上将驱使状态变量Y。或者说，一旦我们发现了最优控制变量路径，就能构造相关的状态变量路径。特征：一个“自控”系统。而且t不直接作为变量体现在方程中，从而，最优汉密尔顿函数——沿Y，U，X的最优路径取值的H函数——将在时间上有一个常数值。关于目标函数：改变V的大小的，是。例子1，一个利用最大化的长期计划垄断企业面临动态需求函数为了使企业产出应该是。总收益函数假设总成本函数依赖于产出水平，于是：这样，总利润函数为：假设时期为10年，则目标函数为：对于时间区间中的每个价格路径，必有相应的一个特定的10年利润值，该企业目标是寻求最优价格路径，以最大化10年期利润值。例子2：一个经济的社会福利由来自于消费的效用来度量，采用生产函数并假设没有折旧，那么，从而，目标函数为假设L是外生的，决策者要选择一条最优的K变化路径，使最大化总U。求解：最大值原理（一阶必要条件）。共态变量和汉密尔顿函数。共态变量用来表示，表示状态变量的影子价值，与一样，变量在不同时刻可取不同值，应写作共态变量借以进入最优控制问题的工具是Hamilton function.定义为H：时间终结点，须满足横截性条件最大值原理：最大值原理的条件是：对于所有的 [Y的运动方程] [横截性条件] 符号表示把u作为选择变量关于H最大化，那么，为什么不直接简单用一阶条件呢？如图，区间为。三条曲线表示汉密尔顿函数H对控制变量在特定时刻对于和值的一种可能曲线。曲线1，关于是可微的，出现在处，内点。曲线2，在，边界点，曲线3，在边界点，因此，控制域可能是一个闭集且具有边界解这一事实，要求更广泛的陈述。事实上，在最大值原理之下，甚至不要求H函数关于可微。考察它正是最初设定的状态变量的运动方程的重新表述。是关于状态变量对H的偏导数的负值，最大值原理的经济学解释考虑一家企业，它寻求最大化它在区间上的利润。有单个状态变量资本存量K，并有单个控制变量，它代表该企业在每个时刻必须作出的某种商业决策（诸如广告政策或存货政策）。该企业在时间0的资本存量为，但终结资本存量未定。在任意时刻，企业利润依赖于它当前持有的资本数量以及它当前选择的政策，从而利润函数为但是，政策选择也影响资本随时间变化的速度，即影响。所以，最优控制问题是：自由。共态变量本质上是一个拉格朗日乘子，具有影子价格的概念。一般地，对于任何时刻，是该特殊时刻的资本影子价格。一般表达为，而不是。 ② 函数和利润前景上面问题的汉密尔顿函数是：右端第一项，时间t的利润函数，可以把它视为代表相应于政策的当前利润。右端第二项：函数表示相应于政策的资本变化率，但函数与相乘后，它就转化为一个货币值。所以第二项代表相应于政策的资本价值变化率。可视为的未来利润效应，因为资本积累的目标是为企业将来创造利润开辟通路。这两种效应一般是相互竞争的，如果某个特定政策决定有利于当前利润，那么它在正常情况下将导致未来利润的牺牲。所以，H函数代表了各种政策决定的总利润前景，同时考虑到了当前效应和未来效应。那么，最优选择怎样平衡呢？最大值原理要求关于最大化H函数，即企业必须在每时每刻通过正确选择，努力。具体说，这要求平衡当前利润的前景收益和未来利润的前景损失。为此，分析“”条件弱形式：（运用包络定理）。即（与符号相反）上式表明，最优选择必须平衡此政策造成的当前利润的边际增加量（左边）和该政策通过资本存量变化而引起的未来利润的边际损失量（右边）。 ③运动方程：即： + 若+ 则- 若- 则+ 左端：代表影子价格随时间的下降速度，或影子价格的折旧率。右端第一项：代表资本对当前利润的边际贡献，右端第二项：代表资本对提高资本价格的边际贡献。最大化原理要求：资本的影子价格贬值速度等于资本对企业当前利润和