神经网络控制论讲述.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
神经网络控制论讲述

多网络自学习控制法基本思想是利用逆动力学模型和系统的期望输出yd(k+1)去构造一个期望的控制量ud(k),从而解决了神经控制器Nc在系统模型未知情况下的学习问题。 四、神经网络控制器的设计 单一神经元控制: 适用于单输入单输出系统 wi(t+1)= γwi(t)+ηpi(t) 四、神经网络控制器的设计 如设定值r(t)、对象输出测量值y(t)等。转换部件的输出为神经元学习所需的状态,如设定值r(t)、误差e(t) 、误差变化△e(t)等,控制信号u(t)由神经元通过关联搜索来产生。根据以上模型,采用联想式学习方法,可以得出规范化神经元非模型控制方法: 式中xi(t) i=1,2, ,n 为神经元的输入状态;K为神经元的比例系数; η为神经元的学习速率。 四、神经网络控制器的设计 神经网络的辨识途径有二种: 线性部分的参数已知 可归结为带时滞的多层感知网络模型的学习问题,只是导师学习信号有所不同。 线性部分的参数未知 可归结为带时滞的多层感知网络模型的学习和线性系统的参数估计问题。 二、非线性动态系统的神经网络辨识 对于模型I、II 如果线性部分已知,系统实际输出与模型输出(神经网络输出与线性部分输出之和)的差可以用BP算法来训练神经网络模型 二、非线性动态系统的神经网络辨识 对于模型I、II,如果线性部分未知。采用改进的BP迭代学习算法 二、非线性动态系统的神经网络辨识 设线性部分的未知参数用矢量α表示,非线性部分的神经网络模型参数用W阵表示 针对模型I 二、非线性动态系统的神经网络辨识 由于线性模型和非线性模型的期望输出Z(l+1)和tpj 在这里都是未知的,已知的只是两个模型的输出之和。而它们的期望值应该是系统在当前时刻k+1的实际输出矢量y(k+1)值。因此在实际对如上算法进行计算时可交替使用y(k+1)-y2(k+1)和y(k+1)-y1(k+1)去近似地代替Z(k+1)和tpj 在初始条件完全未知的情况下可以取: 其中ρ为比较大的数字。 二、非线性动态系统的神经网络辨识 举例 5-1 考虑以下模型: y(k+1)=a·y(k)+b·y(k-1)+g(u) 其中a=0.3, b=0.6 g(u)=u3+0.3u2-0.4u 试辨识该系统 二、非线性动态系统的神经网络辨识 解:线性部分,采用递推最小二乘学习法 非线性部分采用前向传播多层神经网络来逼近 选择神经网络结构为Π1,8,4,1, η=0.2, β=0 二、非线性动态系统的神经网络辨识 为了验证辨识效果,采用校验输入信号 : 二、非线性动态系统的神经网络辨识 对于模型Ⅲ,可以用一个NN来逼近,也可以用两个NN来逼近。下面考虑第二种情况: Nf 网络用来逼近可分离的非线性函数之一 f(·) Ng 网络用来逼近可分离的非线性函数之二 g(·) 二、非线性动态系统的神经网络辨识 选指标函数: 根据BP算法的推导思路可得广义误差为: 二、非线性动态系统的神经网络辨识 神经网络系数更新公式为: 在整个算法的计算过程中,交替使用网络的实际输出值opj1(L)和opj2(L),使得广义误差信号可以不断地进行计算和修正,直至最终收敛 二、非线性动态系统的神经网络辨识 * 引言 1 2 3 4 非线性动态系统的神经网络辨识 5 神经网络控制的学习机制 神经网络控制器的设计 神经元控制器的目的在于如何设计一个有效的神经元网络去代替传统控制器的作用,使得系统的输出跟随系统的期望输出。为了达到这个目的,神经网络的学习方法就是寻找一种有效的途径进行网络连接权阵或网络结构的修改,从而使得网络控制器输出的控制信号能够保证系统输出跟随系统的期望输出。 三、神经网络控制的学习机制 学习机制分为: 监督式学习(有导师指导下的控制网络学习 ) 离线学习法 在线学习法 反馈误差学习法 多网络学习法 增强式学习(通过某一评价函数指定下的学习) 三、神经网络控制的学习机制 1、离线学习法 适合静态环境,网络离线训练中选择的性能指标为u-uc的平方误差极小,这一指标并不能保证系统的最终性能yd-y的平方误差极小 三、神经网络控制的学习机制 2、在线学习法: 找出一个最优控制量u使得系统输出y趋于期望输出yd。权阵的调整应该使得yd-y的误差减少最快 适合模型已知的动态环境 三、神经网络控制的学习机制 学习算法: 采用最速下降法 假设系统的Jacobian矩阵已知 三、神经网络控制的学习机制 3、反馈误差学习法 适用于非线性系统

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档