仿生水下机器人的增强学习控制方法研究-research on reinforcement learning control method of bionic underwater vehicle.docx
- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
仿生水下机器人的增强学习控制方法研究-research on reinforcement learning control method of bionic underwater vehicle
摘要仿生水下机器人是近年来水下机器人领域的研究热点之一。仿生水下机器人 复杂的动力学特性和不确定的工作环境使得其运动控制问题非常具有挑战性,直 接影响着整体性能的提升。本文针对一类双波动鳍配置的仿生水下机器人,基于 在增强学习框架下解决其运动控制问题的研究思路,围绕运动控制问题分析、增 强学习算法构建、增强学习姿态镇定、增强学习轨迹跟踪以及试验验证等几方面 内容展开研究,主要工作和研究成果包括:(1)从仿生学启示、仿生波动鳍和仿生水下机器人的动力学特性等角度对一 类双波动鳍配置仿生水下机器人的运动控制问题进行了系统分析。研究了仿生对 象的外部形态和游动特性,基于仿生学启示设计了仿生波动鳍推进器和仿生水下 机器人“双仿生波动鳍+双摆动鳍+双自由度仿生鳔”组合推进控制方案,针对实 际物理装置开展了仿生波动鳍和仿生水下机器人的推力试验和运动试验,获取了 相关的动力学特性,为仿生水下机器人运动控制方法的设计提供了指导。(2)针对机器人控制的实际需求和基本 Q 学习算法的局限性,提出了一种面 向实际机器人控制应用的连续状态-动作空间神经 Q 学习算法(CSANQL 算法), 综合利用前馈神经网络、学习样本数据库、Q 值估计拟合函数、以及基本 Q 学习 算法,实现了在连续状态和连续动作之间的快速有效映射。研究了神经 Q 学习算 法的两种实现结构,揭示了基于 Q 值估计拟合函数实现连续动作的机理,分析了 学习样本数据库在提高算法学习效率方面的作用,阐明了增强学习算法与仿生水 下机器人运动控制的结合途径,为仿生水下机器人增强学习控制方法的研究奠定 了基础。(3)针对仿生水下机器人的姿态镇定问题,从学习优化和学习控制两个层次 提出并设计实现了增强学习自适应 PID 控制、增强学习控制和监督增强学习控制 等三种增强学习姿态镇定方法。研究了基于增强学习的参数自适应机制,分析了 学习样本数据库和监督控制在增强学习控制方法中的重要作用,并通过仿真对增 强学习控制方法在姿态镇定问题中的有效性进行了初步验证。结果表明,增强学 习自适应 PID 控制器能够主动学习最优的 PID 控制器参数,具有较好的姿态镇定 性能;以 CSANQL 算法为基础的增强学习控制器的性能受学习样本数据库的影响, 当学习样本数据库容量适当时能够有效实现姿态镇定目标;监督控制的引入,加 快了学习的收敛速度,确保了学习过程尤其是学习初期输出动作的稳定性,使得 监督增强学习控制器具有比增强学习自适应 PID 控制器和增强学习控制器更好的 姿态镇定性能。(4)针对仿生水下机器人的轨迹跟踪问题,提出并设计实现了一种基于增强第 i 页学习行为的行为控制结构。从复杂的轨迹跟踪任务中提取推进、偏航和定深等三个基本控制行为作为实现各种轨迹跟踪任务的基础,设计了基于增强学习控制方 法的基本控制行为,提出了基于增强学习的行为组合优化方法,并围绕三维空间 中的直线轨迹跟踪和曲线轨迹跟踪任务开展了仿真研究。结果表明,增强学习行 为控制结构能够快速响应目标运动轨迹,在复杂的多通道轨迹跟踪任务中也具有 较好的跟踪控制性能。(5)基于研究组自行研制的仿生水下机器人试验系统,开展了仿生水下机器 人增强学习控制方法的试验研究,从姿态镇定和轨迹跟踪两方面进一步验证了论 文提出的增强学习控制方法的有效性。研究表明,基于 CSANQL 算法的监督增强 学习控制器具有比单纯增强学习控制器或传统 PID 控制器更好的姿态镇定性能; 在基于增强学习行为的行为控制结构作用下,仿生水下机器人能够较好地跟踪设 定的轨迹跟踪任务。上述研究工作和成果在仿生水下机器人的运动控制问题和增强学习控制方法 的实际应用方面进行了有益探索,为在增强学习框架下最终实现仿生水下机器人 的高效自主运动控制奠定了基础。关键词:仿生水下机器人;波动鳍;增强学习;神经 Q 学习;连续状态-动作空间;姿态镇定;轨迹跟踪;运动控制第 ii 页AbstractThe bionic underwater robot is one of the hotspots in the underwater robotics research field in recent years. It has complicated dynamic characteristics and uncertain working environments which make the motion control of bionic underwater robots a challenging problem. This thesis takes the bionic underwater robot with two undulating fins as research object, a
您可能关注的文档
- 方阵幂可验证安全云计算外包方案分析-analysis on outsourcing scheme of square array power verifiable secure cloud computing.docx
- 方酸菁染料的合成与近红外吸收性能研究-synthesis and near infrared absorption of squaraine dyes.docx
- 方形冷弯中厚壁钢管混凝土短柱承载力分析-bearing capacity analysis of square cold-formed medium-thick wall cfst short columns.docx
- 方正集团财务公司组建及运作案例研究方正集团财务公司组建及运作案例研究-case study on the establishment and operation of founder group finance company case study on the establishment and operation of founder group finance company.docx
- 芳基取代噻唑和噻嗪衍生物合成 晶体结构及其生物活性-synthesis of crystal structure and biological activity of aryl substituted thiazole and thiazine derivatives.docx
- 芳腈化反应中水溶剂和微波技术应用-application of water solvent and microwave technology in aromatization reaction.docx
- 芳基二氢萘类木脂素不对称仿生合成-asymmetric biomimetic synthesis of aryl dihydronaphthalene lignans.docx
- 方中空夹层钢管混凝土柱在压扭受力下的分析-analysis of square hollow sandwich steel tube concrete column under compression and torsion.docx
- 芳烃氯甲基化反应新方法分析-analysis of new methods for chloromethylation of aromatic hydrocarbons.docx
- 芳烃friedel-crafts酰基化反应固体酸催化剂的分析-analysis of solid acid catalyst for aromatic fried el - crafts acylation reaction.docx
- 仿真技术在船厂车间层生产计划调度中的应用分析-application and analysis of simulation technology in shipyard workshop floor production planning and scheduling.docx
- 仿真焊接软件系统关键技术的分析与应用-analysis and application of key technologies in simulation welding software system.docx
- 访谈类节目中转折连接成分的话语标记功能——基于《鲁豫有约》的多角度分析-discourse marker function of turning connection components in interview programs - based on the multi-angle analysis of lu yu youyue.docx
- 仿真器运动控制系统的算法分析-algorithm analysis of simulator motion control system.docx
- 仿生机器鱼推进波形调节控制及实验分析-control and experimental analysis of bionic robotic fish propulsion waveform adjustment.docx
- 纺机企业erp中生产管理子系统的分析与实现-analysis and implementation of production management subsystem in textile machinery enterprise erp.docx
- 仿真综合集成环境中资源描述方法与技术研究-research on resource description method and technology in simulation integrated environment.docx
- 仿真假体视觉下面孔识别的神经生理学分析-neurophysiological analysis of face recognition in artificial prosthesis vision.docx
- 纺线张力在线监控系统设计-design of on-line monitoring system for textile yarn tension.docx
- 纺织行业中80后员工的激励模式分析-analysis on the motivation mode of post - 80s employees in textile industry.docx
原创力文档


文档评论(0)