- 35
- 0
- 约6.07千字
- 约 18页
- 2016-04-12 发布于贵州
- 举报
第三章 最优控制
第一节 最大值原理概述
在变分法中,首要关注的是最优状态路径,由它确定最优值;在最优控制中,寻求一个控制变量的最优控制时间路径;而动态规划关注的是最优值函数,通过它寻求一个最优策略函数,即控制对状态的反应。后者在离散与不确定性问题中更重要。
一、最优控制的最简单问题
最优控制的最简单问题是:
,自由,、给定 (1)
有时也指定的变化区域:。是自由的,因为推导过程中,我们是使(而不是)任意变化来找到最优值。从直观上讲,如果限定了,不能真正任意变化。此外,与变分法不同,不要求全局可微,只要求分片(piecewise)可微即可;的要求是分片连续。在最优控制问题中,选择的变量是,可直接处理的约束问题,并且容许角点解。
二、共态变量(或协态变量,costate variable)和汉密尔顿函数
问题的求解中我们要用到一个关键的表达即汉密尔顿函数:
(2)
是一个动态的乘子函数,它实质上就是动态的拉格朗日乘子,所以具有与拉格朗日乘子同样的含义。在后面的表述中,在不引起歧义的情况下,我们将省略、与中的隐含自变量。
三、最大值原理
我们先给出最大值原理的结果,熟悉了以后再来推导与解释。最大值原理为,问题(1)的解满足下列式子:
, (3)
原创力文档

文档评论(0)