§7.4动态规划与离散系统最优控制.docVIP

下载本文档

4
0
约1.85千字
约 22页
2018-04-02 发布于湖北
举报
版权申诉

§7.4动态规划与离散系统最优控制.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

§ 7. 4 动态规划与离散系统最优控制 1. 动态规划基本原理最优性原则应有如此性质: 即无论(整个过程的)初始状态和初始决策如何，其余(后段)各决策对于由第一个决策(后)所形成的状态作为(后段)初始状态来说，必须也是一个最优策略。用式表示阶段变量n(分析次序) 状态变量x 决策变量决策组损失(效益)函数:对x用决策所付代价(效益) 后部最优策略函数由x至终最小损失(最大效益) A到D的最短路线解 3阶段的决策过程，在CD段(首), (分析)阶段变量; 在BC段(首), (分析)阶段变量；，；，；，；在AB段，阶段变量；，；所以整个过程的最优策略为：，，，即最优路线为。穷举算法：共有个策略，每策略做次加法 ( 次加，有次比较，动态规划：在段，有3个加， 2 个比较运算，在()~2段, 有加，个比较运算，在1段，无加，也无比较运算， ( 有次加，次比较(是N的线性) ( 确定最优策略； 2. 离散系统最优控制设，， (7.21) 指标 (7.22) 求,使(7.22)式最小. 常取， . 或(半正定)，(正定). 意: 与的各个分量上的权值，称为权矩阵。实用。控制次序公式推导 (i)时标在下标处， (ii) 分离出来，权矩阵改记为S， (iii)添常数项(影响极值，但不影响极值点)， (7.23) 定理7.4 系统 (7.21)，使指标(7.23)为最小的最优控制。其中: (7.24) 证运用(7.20)式，最后一段的损失为是的二次型函数，因是正定的，故必有唯一最小值，由多元极值的必要条件，得，由正定，知其可逆，从而得 (7.25) 因此最后一段的最小损失为 (7.26) 由公式组(7.25)中第一个公式得 (7.27) 将(7.27)代入(7.26)，经整理后，有逆向第二段的最优化。根据动态规划最优化原则, 得记 , (7.28) 则最后二阶段的性能指标与最后一段指标类比, 可得其中由(7.28)所确定, 最后二段的最小损失值为 , 以此类推, 可得公式组(7.24)。推论若状态矩阵是可逆的，则有 (7.29) (证明略)。 (1) 预先逆序计算, (从已知{Ф，Г}和{S，Q，R}) (2) 然后顺序控制. 例7.9 设一维指标，计算、、和。解这里，由递推公式，得逆向计算表1 13 12 11 10 9 8 7 6 5 4 3 2 1 0 0 1.03 2.39 3.51 4.11 4.36 4.46 4.49 4.52 4.52 4.52 4.52 4.52 0 4 11.75 21.99 30.32 4.83 36.74 37.47 37.74 37.83 37.87 37.88 37.88 37.88 顺向最优控制和最优状态如表2，表2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 10 5.98 3.58 2.14 1.28 0.76 0.46 .28 0.18 0.12 0.10 0.10 0.13 0.19 45.10 26.97 16.15 9.65 5.77 3.41 2.05 1.22 0.74 0.42 0.24 0.10 0 趋于常值. 定理.7.5 若 (7.21)完全能控，对于无限时间指标，必有和。 (7.30) (证明略) 定值控制称为调节. 由此得到最优控制(为最优调节，最优调节器的表达式为用(7.30)中F代，所得的状态反馈控制称为稳态最优调节器，F称为稳态最优反馈增益。 F的计算 (1) 用计算机编程求得; (2) 据定理7.5极限的存在性，在 (7.29)两边求极限 (7.31) 中解出F。其中P为非负定。 (3) 也可对公式组7.24的两边求极限而得。例 7.10 例7.9中的指标改为求稳态最优调节器。解一维系统，由，故满秩，系统完全能控，由定理7.5稳态最优增益必存在。各参数代入(7.31)得，整理为，求得和。从而最优调节器为第 12 页共 21 页第 6 页共 21 页