最优控制--汉密尔顿函数.ppt

下载文档 降价啦

62
0
约3.06千字
约 60页
2019-03-06 发布于江苏
举报
版权申诉
保障服务

最优控制--汉密尔顿函数.ppt

1、本文档共60页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

在这类极值问题中，要处理两种类型的等式约束。一是微分方程约束，一是终端边界约束。根据拉格朗日乘子法，要引入两面两个乘子矢量，一个是n维λ(t)，另一个是q维μ，将等式约束条件泛函极值化成无约束条件泛函极值问题来求解。为此，构造增广泛函写出哈密顿函数 (5-22) (5-21) 于是 (5-23) 对上式中最后一次作分部积分，得 (5-24) (5-25) (5-26) (5-27) 这是一个可变端点变分问题。考虑x(t)，u(t)， tf相对于它们最优值x*(t)，u*(t)，t*f的变分，并计算由此引起J′的一次变分δJ′。设图4 可变终端各变分间的关系从图4可知在端点处变分之间存在下列近似关系式中δx(t*f)——x在t*f时的一次变分； δx(t*f+ δtf)——x在tf =t*f+ δtf时的一次变分。式(5-28)描述了在可变终端情况下，x在这两个时刻上变分的近似关系，近似式中忽略了高阶无穷小量。 (5-28) 考虑到式(5-24)右边第一项和第二项的一次变分各有两项：因此，有 (5-29) 注意到δtf、δx、δu任意性，及泛函极值存在的必要条件δJ′=0式(5-29)可得极值必要条件如下： (5-30) 式中H[x(tf), u(tf), λ(tf), tf]函数H最优轨线终端处的值。边界条件x(t0)= x0 (5-32) 终端时刻由下式计算 (5-31) 终端时刻由下式计算式中H[x(tf), u(tf), λ(tf), tf]函数H最优轨线终端处的值。上述总共个2n+r+q+1方程，可联解出 2n+r+q+1个变量。 (5-32) 最后，分析哈密尔顿函数沿最优轨线随时间的变化规律。哈密顿函数H对时间的全导数为 (5-33) 如果u为最优控制，必满足及 (5-34) 因此，有上式表明，哈密顿函数H沿最优轨线对时间的全导数等于它对时间的偏导数。当H不显含t时，恒有即常数 (5-35) 这就是说，对定常系统，沿最优轨线H恒为常值。例4：给定系统状态方程为设初始状态x(0)= 0，终端状态约束曲线 x1(1)+x2(1)-1=0求使性能泛函取极小时的最优控制u*(t)及最优轨线x*(t)。解这是个终端时间tf给定，但终端状态受约束的拉格朗日问题。哈密顿函数由性能泛函取极值的必要条件，得它们的通解为由边界条件确定积分常数代入解得由终端约束方程 x1(1)+x2(1)=1 可解出μ=-3/7。最优解 * 第五章用变分法求解连续最优控制问题 —有约束条件的泛函极值上节讨论没有约束条件的泛函极值问题。但在最优控制问题中，泛函J所依赖的函数总要受到受控系统状态方程的约束。解决这类问题的思路是应用拉格朗日乘子法，将这种有约束条件的泛函极值问题转化为无约束条件的泛函极值问题。一、拉格朗日问题考虑系统 ——n维连续可微的矢量函数。 (5-1) 式中；；设给定，初始状态为x(t0)=x0，终端状态x(tf)自由。性能泛函为寻求最优控制u(t)，将系统从初始状态x(t0)=x0 转移到终端状态x(tf)，并使性能泛函J取极值。 (5-2) 将状态方程式(5-1)写成约束方程形式应用拉格朗日乘子法，构造增广泛函式中λ(t)——待定的n维拉格朗日乘子矢量。 (5-3) 定义纯量函数称H[x,u,λ,t]为哈密尔顿函数。则或 (5-4) (5-5) (5-6) 式中 (5-7) 对式(5-5)右边第二项作分部积分，得将上式代入式(5-5)，得 (5-8) 使J′取极小的必要条件是，对任意的δu和δx，都有δJ′=0成立。设u(t)和x(t)相对于最优控制u*(t)及最优轨线 u*(t)的变分为δu和δx，计算由δu和δx引起的 J′的变分为：因此得 (5-9) (5-10) (5-11) (5-12) 式(5-9)称为动态系统的伴随方程或协态方程， λ又称为伴随矢量或协态矢量。式(5-10)即系统的状态方程。式(5-9)与式(5-10)联立称为哈密尔顿正则方程。式(5-11)称为控制方程，这个方程是在假设δu为任意，控制u(t)取值不受约束条件下得