- 12
- 0
- 约5.9千字
- 约 7页
- 2017-01-16 发布于重庆
- 举报
最优控制总结(小五字体,每页四个)
C1 1.最优控制问题
三个基本要素:被控对象/系统的数学模型,物理约束条件及性能指标。数学描述:设被控对象的状态方程及初始条件为;其中,为状态向量,为状态向量的可容许集;为控制向量,为控制向量的可容许集。试确定容许的最优控制和最优状态轨迹,使得系统实现从初始状态到目标集的转移,同时使得性能指标达到极值。
2.分类:(1)系统状态方程形式(连续,离散)(2)最优控制形式(开环,闭环) (3)实际应用(时间,燃料,能量,终端) (4)终端条件(固定,自由) (5)被控对象形式(精确,随机)。
3.静态最优化问题由优化变量、目标函数及约束条件组成的静态优化问题可以描述为:在满足一系列约束条件的可行域中,确定一组优化变量,使目标函数达到最优值(极大值或极小值)。
数学描述:,
静态、动态最优化区别:静态最优化问题,也称为参数最优化问题,它的三个基本要素是优化变量、目标函数和约束条件,其本质是解决函数求极值的问题。 动态最优化问题,也称为最优控制问题,它的三个基本要素是被控对象数学模型、物理约束条件和性能指标,其本质是解决泛函求极值的问题。
C2(静态)
1.最优梯度法(1)多变量目标函数沿着初始搜索点的负梯度方向搜索,函数值下降最快,又称最速下降法;(2)多变量无约束。
2.惩罚函数法(1)根据具体的最优换问题构造合适的惩罚函数,将多变量有约束最优化问题转换为一系列多变量无约束最优化问题,从而采用合适的无约束优化方法继续完成求解;(2)多变量有约束(外点法:等式约,不等式约束;内点法:不等式约束)。
3.拉格朗日乘子法(1)通过构造拉格朗日函数,将原多变量有约束最优化问题转化为一个多变量无约束最优化问题,从而采用合适的无约束方法继续完成求解;(2)多变量有约束(等式约束,不等式约束)。
4.最优梯度法计算
梯度定义,Hessian矩阵,最优梯度法(无约束):迭代,,终止误差
例:;;;,是极小值点。
5.拉格朗日乘子法计算
有约束最优化:约束为:
(1) 等式约束:,利用解出极大值点或极小值点。
(2) 不等式约束:,引入附加变量使得不等式约束变为等式约束:,再有等式拉格朗日乘子法.
6.惩罚函数法计算
(1)外部:1)等式约束,用求解出,令求出;
2)不等式约束:
3) 复合形式:
(2)内部:只适用于不等式约束,惩罚函数,,利用求解出,令求出
C3(变分法)
1.一次变分求解,变分规则:,
2.泛函取极值必要条件
欧拉方程,横截条件方程
问题描述 边界条件 横截条件 固定,固定 无 固定,自由 自由,固定 自由,自由 且互相独立 自由,自由,且通过 , 3.欧拉方程特殊结果
(1)被积函数只依赖于 : 直线
(2)被积函数只依赖于t和 :,先求,再积分求
(3)被积函数只依赖于和 :
(4)常用积分:1)原点到直线的距离为;到平面的距离为;
2)曲线长度
4.角点条件
(1) ,不相关:
(2) ,相关:
5.有约束泛函极值
(1)微分方程约束:存在约束,引入拉~乘子,拉格朗日函数:,变为无约束。
(2)等周约束:存在约束,引入,拉格朗日函数为,必要条件为:a)对L的欧拉方程 b) c) 。
6.离散欧拉方程
,离散欧拉方程,
自由时横截条件为:
7.变分法求解最优控制问题目标:,约束,构造哈密顿函数,正则方程:,控制方程: (哈密顿函数性质:, 当中不显含t,恒为常数)
问题描述 边界条件 横截条件 H在终端时刻处满足 固定 固定 无 无 自由 受约束 自由 固定 无 自由 受约束 C4(极小值原理)
1.极小值原理提出的意义及核心结论
意义:变分法求解最优控制问题基于假设(1)容许控制量和容许状态量都是没有任何约束的;(2)哈密顿函数对是连续可微的.这在实际系统中往往不能满足。极小值原理有效地克服了经典变分法的局限性,除了可以很好地处理控制向量受约束的情况,还不要求哈密顿函数对控制向量的连续可微性。核心结论:使泛函取得极小值的最优控制满足的必要条件:,,即在区间内,对于任意的可容许控制变量,都有最优控制使得哈密顿
原创力文档

文档评论(0)