最优控制--汉密尔顿函数.ppt

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
在这类极值问题中,要处理两种类型的等式约 束。一是微分方程约束,一是终端边界约束。根据 拉格朗日乘子法,要引入两面两个乘子矢量,一个 是n维λ(t),另一个是q维μ,将等式约束条件泛函 极值化成无约束条件泛函极值问题来求解。 为此,构造增广泛函 写出哈密顿函数 (5-22) (5-21) 于是 (5-23) 对上式中最后一次作分部积分,得 (5-24) (5-25) (5-26) (5-27) 这是一个可变端点变分问题。考虑x(t),u(t), tf相对于它们最优值x*(t),u*(t),t*f的变分,并计 算由此引起J′的一次变分δJ′。设 图4 可变终端各变分间的关系 从图4可知在端点处变分之间存在下列近似关系 式中δx(t*f)——x在t*f时的一次变分; δx(t*f+ δtf)——x在tf =t*f+ δtf时的一次变分。 式(5-28)描述了在可变终端情况下,x在这两个时刻 上变分的近似关系,近似式中忽略了高阶无穷小量。 (5-28) 考虑到式(5-24)右边第一项和第二项的一次 变分各有两项: 因此,有 (5-29) 注意到δtf、δx、δu任意性,及泛函极值存在 的必要条件δJ′=0式(5-29)可得极值必要条件如下: (5-30) 式中H[x(tf), u(tf), λ(tf), tf]函数H最优轨线终端处的值。 边界条件x(t0)= x0 (5-32) 终端时刻由下式计算 (5-31) 终端时刻由下式计算 式中H[x(tf), u(tf), λ(tf), tf]函数H最优轨线终端处 的值。上述总共个2n+r+q+1方程,可联解出 2n+r+q+1个变量。 (5-32) 最后,分析哈密尔顿函数沿最优轨线随时间 的变化规律。哈密顿函数H对时间的全导数为 (5-33) 如果u为最优控制,必满足 及 (5-34) 因此,有 上式表明,哈密顿函数H沿最优轨线对时间的 全导数等于它对时间的偏导数。 当H不显含t时,恒有 即 常数 (5-35) 这就是说,对定常系统,沿最优轨线H恒为常值。 例4:给定系统状态方程为 设初始状态x(0)= 0,终端状态约束曲线 x1(1)+x2(1)-1=0求使性能泛函 取极小时的最优控制u*(t)及最优轨线x*(t)。 解 这是个终端时间tf给定,但终端状态受约束 的拉格朗日问题。 哈密顿函数 由性能泛函取极值的必要条件,得 它们的通解为 由边界条件确定积分常数 代入解得 由终端约束方程 x1(1)+x2(1)=1 可解出μ=-3/7。 最优解 * 第五章 用变分法求解连续最优控制问题 —有约束条件的泛函极值 上节讨论没有约束条件的泛函极值问题。但在 最优控制问题中,泛函J所依赖的函数总要受到受控 系统状态方程的约束。解决这类问题的思路是应用 拉格朗日乘子法,将这种有约束条件的泛函极值问 题转化为无约束条件的泛函极值问题。 一、拉格朗日问题 考虑系统 ——n维连续可微的矢量函数。 (5-1) 式中 ; ; 设给定 ,初始状态为x(t0)=x0, 终端状态x(tf)自由。性能泛函为 寻求最优控制u(t),将系统从初始状态x(t0)=x0 转移到终端状态x(tf),并使性能泛函J取极值。 (5-2) 将状态方程式(5-1)写成约束方程形式 应用拉格朗日乘子法,构造增广泛函 式中λ(t)——待定的n维拉格朗日乘子矢量。 (5-3) 定义纯量函数 称H[x,u,λ,t]为哈密尔顿函数。则 或 (5-4) (5-5) (5-6) 式中 (5-7) 对式(5-5)右边第二项作分部积分,得 将上式代入式(5-5),得 (5-8) 使J′取极小的必要条件是,对任意的δu和δx, 都有δJ′=0成立。 设u(t)和x(t)相对于最优控制u*(t)及最优轨线 u*(t)的变分为δu和δx,计算由δu和δx引起的 J′的变分为: 因此得 (5-9) (5-10) (5-11) (5-12) 式(5-9)称为动态系统的伴随方程或协态方程, λ又称为伴随矢量或协态矢量。 式(5-10)即系统的状态方程。 式(5-9)与式(5-10)联立称为哈密尔顿正则方程。 式(5-11)称为控制方程, 这个方程是在假设δu为任意,控制u(t)取值 不受约束条件下得

文档评论(0)

汪汪队 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档