- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计算机控制系统第十一章计算机控制系统第十一章计算机控制系统第十一章
问题的表达形式 设受控过程由连续时间模型描述 对于非时变系统,采样系统模型描述为: 其中v和e是离散时间高斯白噪声过程,其均值为零,且 (11.3) 性能准则 我们用的设计准则是一种对状态和控制信号的 幅值进行加权的方法。一种性能准则可以选为状态的功 率,即: 状态分量可以有不同的维数,因此可以用更一般的加权 形式来代替上式: 其中,Q1c是对称半正定矩阵。对中止时刻的控制信号和 状态可以用类似的惩罚方法,由此形成了这样一个控制 问题,控制的目的是使损失函数: 为最小,其中: 矩阵Q0c、Q1c和Q2c是对称的并且至少是半正定 的。损失函数中的这些矩阵可能与时间有关。 (11.4) 采样损失函数 损失函数(11.4)式是以连续时间形式表示的。先要把它转 变为离散时间损失函数。在长度为h的区间上对(11.4)式 积分,得出: 其中: 把(11.2)式代入(11.5)式,再考虑到每个采样周期内u(t) 为常数就得到: (11.5) 其中: 于是,当u(k)在采样周期内为常值时,使损失函数(11.4)式为最小就等同于使下列离散时间损失函数为最小: (11.6) (11.7) (11.8) (11.9) (11.10) 配方 设损失函数的形式为: 存在一个L满足: 使得损失函数(11.11)式可以写成: 将(11.12)式代入到(11.13)式中可以很容易地证明这点。 将(11.13)式称为配方。由于(11.13)式是u的二次型,而 且两项均大于或等于零,因此可以容易的看出(11.11)式 在 u=-Lx 时取最小值,而且如果Qu是正定的,L就是唯一 的。最小值为: (11.11) (11.12) (11.13) (11.14) (11.15) 11.2 线性二次型控制 11.2.1 确定性情况 对于确定性系统,可表示为: (11.13) 最优性原理表明,一个最优化策略具有如下性质:无论初始状态和初始决策怎样,相对于从第一次决策导出的状态而言余下的决策一定是最优的。 根据这一思想,从终止时刻N开始按逆时间顺序往前推,有可能确定最后一步的最佳控制律,即向后迭代至初始时刻就可以确定出最优控制律。这一过程叫做动态规划,或叫贝尔曼动态规划。 定理11.1 确定性系统的LQ控制 考虑系统(11.16)式。允许u(k)是x(k),x(k-1),…的函数。 引入: 其终端条件为S(N)=Q0。假设Q0是正半定的, 是正定的,则存在一个惟一的允许控制策略: u(k)=-L(k)x(k) 其中: 使损失函数(11.9)式取最小值。此最小值为: 另外,S(k)是正半定的。 证:采用动态规划证明此定理 对于k=N,有: 其中: 对于k=N-1,有: 基于配方法则: 得最小损失: 其中: 离散时间黎卡提方程 假定黎卡提方程(11.17)在区间 内有一个非负定 的解,那么可得: 其中,L(k)由(11.19)式定义,且 x(k+1)由(11.3)式给出 例11.1 双重积分器的LQ控制 考虑双重积分器(参阅例A.1),并取采样周期h=1。设 (11.9)式中的加权矩阵为: 现在可以研究权重的影响。针对不同的ρ值算出了平稳 反馈向量。图展示出一些值的状态和控制信号。 ρ =0时表示仅惩罚输出,这时得到的控制器与节的 有限拍控制器相同。当ρ增加时,控制信号的幅度就减少。 图表示出作为控制加权ρ的函数的平稳L向量。当 ρ增大时,增益趋近于零且几乎没有反馈。 例11.2 时变控制器 考虑积分器过程: x(k+1)=x(k)+u(k) 令损失函数为: 即时间范围仅为五步。黎卡提方程和控制器增益变为: 图展示了当x(0)=1时,针对不同q0值的s(k),l(k)和状态 的轨迹。值q0对应于黎卡提方程的平稳解。当q0增大 时,x(5)趋近于零。 代数黎卡提方程 控制律: 定理11.3 闭环系统的稳定性 设系统(11.16)式是时不变的,并设损失函数(11.9)式使 得(11.10)式中的Q是正定的。假设(11.33)式存在有一个 正定的定态解 ,那么,定态最优控制策略: 给出的闭环系统: 是渐进稳定的。 定理11.4 SISO系统的闭环极点 设输入和输出是标量,而且假定把定态最优反馈用于时 不变系统。进而假定在损失函数中仅惩罚输出和控
文档评论(0)