- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
智能控制学习控制迭代学习控制
迭代学习控制的稳定性 定理6-3:记控制输入uj(t)为第j次迭代中反馈控制和前馈控制两项的线性组合,即 其中 为误差反馈控制项,且 ; 为前馈学习控制项,由学习控制器产生。 则前述控制下的跟踪误差为 其中,a0, b≥λ2 , μv, v=a+(2+1/a)(βm+αm|ud|m ) 精度分析 定理(6-3)表明了系统的最大跟踪误差 与 的大小成正比。因此只要控制序列 在整个时间域[0,T]内收敛于 ,则系统的跟踪误差可以达到任意精度。 这样,系统的轨迹跟踪控制问题就归结为寻求在时间域[0,T]上一致收敛于 的前馈输入控制序列 的问题了。 梯度法 定义指标函数 应用梯度法我们得到第j次 迭代计算的公式: η的取值范围必须满足0η2 实际迭代算法 问题: 一般不能获取。 利用已知的 去代替未知的 : 学习结构图 实际迭代算法的收敛性 定理6-4:假设 和 有界,即 且 a,b,d的取值满足下列不等式: (1-η)db-1-2r0=l10 (2-η)db-1-(r0+2a/λ1)=l20 其中 p=min(al1,l2); q=(βm+αmu0)/λ1 。 则新的迭代学习策略是收敛的,即: 其中 目标函数 定义为: 定理6-5:如果状态误差取:xd(t)-xj+1(t) 学习规则改为: 则 a,b,d的取值满足下列不等式: (2+η)db-1-2r0=l10 (2+η)db-1-(r0+2a/??1)=l20 系统收敛。 另一种迭代方法的收敛性 迭代学习控制的特点 不需要精确的模型参数,只要一些模型的极限参数; 对周期性的系统扰动完全可以通过迭代学习来克服,对随机扰动也有较强的抑制能力。 学习控制的结构相当简单,学习的信息只须利用线性反馈控制量。 学习算法的收敛条件非常简单,具有有界的不确定性。 6.1.1 迭代学习控制的基本思想 6.1.2 线性时变系统的迭代学习控制 6.1.3 一类非线性动态系统的迭代学习控制 6.1.4 多关节机械手的迭代学习控制 6.1.5 迭代学习控制面临的挑战 6.1 迭代学习控制 6.1.4多关节机械手的迭代学习控制 固定负载下的机器人迭代学习控制 负载经常变化下的机器人轨迹跟踪的迭代学习控制方法 机械手动力学方程 D(q):?惯量矩阵; ? : 非线性哥氏力和向心力; G(q):? 重力项; τa :不确定力矩项(包括磨擦力矩等); τ :?各关节的输入力矩。 状态方程 取 迭代学习策略 10次迭代学习控制效果 期望轨迹曲线 实际系统响应 第一关节 10次迭代学习控制效果 期望轨迹曲线 实际系统响应 第二关节 10次迭代学习控制效果 期望轨迹曲线 实际系统响应 第三关节 负载经常变化下的机器人迭代学习控制 一种基于知识库的改进迭代学习算法 改进迭代学习算法的目的在于如何尽快地得到准确的前馈补偿力矩τd,当负载发生变化时,它的基本思想是利用一组已知的、按一定规则排列的、与τd相关的数据库,并通过推理机制来求得当前负载m下准确的前馈补偿力矩τd(m)。 能经过一个周期的运行达到高精度跟踪控制的目的。 6.1.1 迭代学习控制的基本思想 6.1.2 线性时变系统的迭代学习控制 6.1.3 一类非线性动态系统的迭代学习控制 6.1.4 多关节机械手的迭代学习控制 6.1.5 迭代学习控制面临的挑战 6.1 迭代学习控制 6.1.5 迭代学习控制面临的挑战 向一般系统的推广问题; 学习收敛的速率问题; 要求初始状态在期望轨迹上; 如果期望轨迹发生变化,学习必须重新进行。 第6章 学习控制 -迭代学习控制 智能控制基础 目录 6.1 迭代学习控制 6.2 增强学习 6.1.1 迭代学习控制的基本思想 6.1.2 线性时变系统的迭代学习控制 6.1.3 一类非线性动态系统的迭代学习控制 6.1.4 多关节机械手的迭代学习控制 6.1.5 迭代学习控制面临的挑战 6.1 迭代学习控制 6.1.1 基本思想 迭代学习(Iterative learning)的基本思想在于总结人类学习的方法,即通过多次的训练,从经验中学会某种技能。 迭代学习控制是智能控制中具有严格数学描述的一个分支。它以极为简单的学习算法,在给定的时间区间上实现未知被控对象以任意精度跟踪某一给定的期望轨迹的控制问题。 特点 控制器在运行过程中不需要辨识系
文档评论(0)