两轮自平衡柔性机器人的仿生自主学习控制.docxVIP

两轮自平衡柔性机器人的仿生自主学习控制.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
两轮自平衡柔性机器人的仿生自主学习控制 摘要:木文提一种丿鸟丁-斯金纳的操作性杀件发射理论的OCPA(opcrant conditioning probabilistic automaton操作 性条件发射概率机器人)仿生自主学习控制系统,为的是解决两轮柔性机器人的平衡问题。该OCPA学习系统由两个 阶段组成:在第一个阶段,一个操作性动作在一套操作性动作里随机选择,然后作为控制系统的输入;在第二个阶 段,学习系统采集该系统的方位信息并使用它进行优化,直到达到控制目标。该操作性动作集的范围会在学习过程 中自动降低以避免小概率事件发生。在论文中对设计OCPA学习系统进行了理论分析,从理论上证明了操作性条件 学习机制在OCPA学习系统中的收敛性,即操作性的行动爛收敛到最小的学习过程。然后OCPA学习系统被应用于 两轮自平衡柔性机器人的姿势平衡控制。机器人在初始状态下是没冇保持平衡的技巧的,并且每个操作在操作性集 中的选中概率是一样的。随着学习进行,选中最佳操作的概率会逐渐变成1,而且操作性的行动嫡逐渐趋向最小,因 此机器人逐渐学会姿态的平衡技巧。 关键词:两轮柔性机器人;姿态平衡控制;操作性条件反射;概率机器人;仿生自主学习 1引言 两轮直立机器人是最重要的移动机器人之 一:这种类型的机器人的重要并不仅仅体现在实 际应用领域,也是科学家发展机器人技术和控制 科学的新思路的重要平台之一。在过去,大多数 两轮直立机器人是刚性的,但随着机器人技术和 柔性口动技术的发展,能模仿人的功能的柔性机 器人已经成为新的研究热点。北京工业大学人工 智能与机器人研究所已经开发出采用弹簧模仿 人的脊椎的两轮柔性机器人。由于其非线性特性, 这种机器人的建模与控制成为一个具有挑战性 和引人入胜的任务。 对两轮直立刚性机器人的平衡控制问题深 入研究会促进最优控制方案的开发。然而,这样 的结果并不适用于柔性机器人,因为其数学模型 要复杂得多。众所周知,对复杂机器人系统的一 个有效控制方案便是学习控制。其中,可用于两 轮柔性机器人的一种学习方案便是霍普菲尔徳 神经网络。然而,这种方法学习速度很低,并且 不能应用于实际的机器人系统。一个名为仿生自 主学习控制不同的方法可能比一般的学习方法 好。该方法的主要特征是它模拟原始的动物的学 习方法。 仿生自主学习策略适用于实时捕捉动态系 统中的问题,因为它需要较少的先验系统信息。 这种方法,学习型机器人法learning automaton (LA)已被广泛用于在人工智能和机器学习领 域。然而,LA学习算法具有一个缺陷,这使得 它不适用于这个特殊问题:它忽略智能体本身的 取向信息,往往不能学习到最优的行为。本文提 出了一种新的仿生自主学习模式,克服Fla法 的这个缺陷,适用于复杂的两轮柔性机器人的平 衡控制。 仿生自主学习方法是由斯金纳开发的操作 性条件反射(OC)机制派生的。斯金纳OC是 研究人类和动物行为的重要工具,现在被用于机 器人技术来模仿OC行为。自20世纪90年代中 期开始,美国卡内基?梅隆大学主要研究关于斯 金纳OC的汁算理论和计算模型,期望这种模型 能复制动物学习操作或控制的实验,然后在自主 机器人上实现这种模型。 近些年來,我们很多有关仿生模型的研究都 是基于斯金纳OC。一个仿生学习模型的设计是 基于已成功应用于倒立摆系统的模糊逻辑和概 率机器人。然而,OC学习算法是线性的,操作 性动作集是固定的。因此,该学习模式很难适用 于两轮柔性机器人系统。随后,非线性OC学习 的目的是当其应用于两轮机器人系统时取得良 好的学习表现。但是,作为规则结论集的操作性 动作是固定的,结果上来说学习精度差,并且这 个学习策略无法应用于两伦柔性机器人系统。 本文构建了基于斯金纳OC和概率机器人 的操作性条件反射概率机器人(OCPA)仿生自 主学习系统,它可以用于控制两轮柔性机器人的 平衡。在第一个阶段,一个操作性动作在一套操 作性动作里随机选择,然后作为控制系统的输入; 在第二个阶段,学习系统采集该系统的方位信息 并使用它进行优化,直到达到控制目标。如果有 小概率事件发生,那么系统的性能必将受到影响 ——因此,有必要实现该学习方法,使得操作性 动作集可自动减小范圉以除去无用的动作事件。 在制作一个更好的自我学习和组织系统的过程 屮,该学习方法的这种性质同时提高了其学习过 程的速度和精度。仿真和实验结果表明:OCPA 学习系统可以应用于解决两轮柔性机器人的平 衡控制问题, 2 OCPA学习系统的设计 2.1 OCPA学习系统 斯金纳OC理论可以概括?为:动物的神经组 织随着动物的学习过程改变,改变的结果将构成 规则和动作之间的关系。从规则到动作再反馈给 规则,这是不断循环的。不断从规则到动作,从 动作再反馈给规则的这个循环过程,

您可能关注的文档

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档