基于伪逆的反复学习控制(翻译一).docVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于伪逆的反复学习控制(翻译一)

基于伪逆的反复学习控制 Jayati Ghosh and Brad Paden 摘要——学习控制是用于一固定时间间隔内重复作用的跟踪控制的有效方法。本文给出一种反复学习控制算法,适用于一些具有扰动和初始误差的非线性非最小相位对象。该算法要求对一线性对象的近似转换而非精确转换。这种方法的一个优点是不需区分对象的输出。渐进轨迹误差的范围通过一精确的试验列出,并且可以看到其随着扰动范围持续的增大。该控制器的结构是这样的,其低频部分的轨迹汇合要比高频部分快。 索引术语——反复学习控制,非线性跟踪,伪逆。 I. 绪论 反复学习控制用到了一类自调整控制器,其某一特定任务的系统性能在同一任务先前性能的基础上逐渐改善和完美。学习控制的最常见应用是在工业生产的机器人控制领域,这里要求机器人执行一个单一的任务,比方说反复在一给定轨迹下取放物体。单独一个反馈控制器时,相同的轨迹误差会一直在反复的试验中存在。相反,学习控制器可以利用前一次执行信息来改进下一次轨迹执行的性能。而在一些应用中,多次重复一个轨迹的要求不利于学习,所以我们将注意力集中在别的一些场合,那里来说学习控制是自然的解决方案。 本文中我们在[1]提出一种反复学习控制算法的修正以使其适用于带有输入扰动和输出传感噪声的非线性非最小相位对象。在章节II,提出一个在起始位置描述一伪逆线性装置的学习控制器。在章节III,举出仿真例子以展示所提学习控制器的性能。最后,章节IV是全文总结。 II.具有扰动的非线性非最小相位对象 本节中,我们为非线性系统提出一个鲁棒迭代学习算法。我们仅考虑方(相同的输入和输出)时不变非线性系统。 A. 系统描述 来考察一个在x = 0时起始近似稳定(也就是说线性对象的所有特征根都在复平面的左半部分)而且输入稳定的非线性系统 这里i为ILC的迭代系数,是输入顺序集合,及,。方程表示系统反复随机的有界扰动;它可以是持续的,非可再生摩擦力,和状态独立的模型误差等等。代表传感器噪声。所期待的轨迹维持在有限的时间域。学习的目的是构建一个输入轨迹的顺序如,这样使系统在[0,T]间“尽可能近的”跟踪轨迹。我们做以下假设: (A1)方程是连续可微的,而是连续的。 (A2),这里的是Banach空间的封闭子集。 (A3)系统是第一渐进稳定和输入状态稳定。 (备注:如果系统不稳定,可以运用我们的方法使其稳定)。 (A4)扰动和分别由bw和bv限制(也就是说,且)。 (A5)所期待的轨迹非常接近于轨迹,其满足以下方程: 针对该系统,在图1.B中给出一个反复学习控制。 B.学习控制器的描述 本节中,图1所示的学习控制器的一个好的候选者可以这样获得,首先对对象进行线性化,然后用一个伪逆的线性装置作为学习控制器。 现代的反复学习控制法则由因式P,线性对象,其伴随矩阵和时域t∈[0,T]组成,也就是: 注意到对所有的i如果(注意在图1中,减因子放置在汇合点之前)。 定义:由于非线性系统(1)是输入状态稳定(A5)且是连续的(A1),因此这样定义一个因果关系的非线性输入到输出的映射P:。因为P是第一状态渐近稳定的(A5),我们定义一稳定时不变的输入到输出线性因式,需要对系统(1)在内线性化: 图1,非线性学习控制系统 P:非线性对象,LC:学习控制器,:负因子 这里,因此,。由于且A为赫兹【在(4)中】,我们可以用代替 而不必改变(4)中定义的输入输出(I_O)映射,因此得到的唯一映射是1—1。 定义:考察伴随系统的I—O映射 由于A是赫兹,-AT 为双曲线的(也就是,所有的特征值都没有零实部),从而(5)式定义了唯一的无关联映射,如Devasia等给出的(参见附录)。。伴随系统满足. 定义:忽略较高阶限制,我们可以在方程(1)的解附近获得一个线性对象: 这里。因为(4)是稳定的,可以根据李亚普诺夫方法证明,如果有界那么(6)也是有界输入输出稳定的。注意,这里我们也可以用代替(如(4)中)而且没有改变输入输出映射。定义。线性稳定系统(6)有解并且定义了一个线性输入输出映射:。 定义:由伪逆【4】的观念启发,我们通过下面的线性因子来定义学习控制器: 因为,我们把“近似反转”称为的α-伪逆。为简单起见,下文把α-伪逆称为简单伪逆。在时域下用(4)和(5): 因为是稳定的,(8)是具有特征根的双曲线,因此,【2】中且是无关联的。在(8)中解,我们可以看到反向算子为: 上面系统的特征根α的连续函数。在极限为双曲线的(因为A为赫兹)。从而我们通常对双曲线选择一个α。系统(9)可以根据Devasia 等人的稳定无关解方法解决。因此, 学习控制器是伪逆且在时域中给出:

文档评论(0)

liudao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档