通过可微仿真基础系统识别实现精确可靠的运动.pdfVIP

通过可微仿真基础系统识别实现精确可靠的运动.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

通过可微仿真基础系统识别实现精确可靠的运动

1111

VyacheslavKovalev,EkaterinaChaikovskaia,EgorDavydenko,andRomanGorbachev

Abstract—准确的系统识别对于减少双足行走中的轨迹漂

移至关重要,特别是在强化学习和基于模型的控制中。在本文motor

command

中,我们提出了一种将系统识别集成到使用可微分模拟的强化

学习训练循环中的新颖控制框架。与依赖直接扭矩测量的传统

方法不同,我们的方法仅使用轨迹数据(位置、速度)和控制输Problem:Deviationin

入来估计系统参数。我们利用可微分仿真器MuJoCo-XLA优sim-realrobottrajectory

化系统参数,确保模拟机器人的行为与现实世界的运动紧密一

致。该框架支持大规模且灵活的参数优化。它涵盖了质量、惯motor

性等基本物理属性。此外,通过神经网络近似处理复杂的系统command

本非线性行为,包括高级摩擦模型。实验结果表明,我们的框架

显著提高了轨迹跟踪性能。与基准强化学习方法相比,旋转偏

Success:Minimizingsim-

译差减少了75%,并且在命令方向上的行进距离增加了46%。realtrajectorydeviation

motor

1command

v补充材料+our

6approach

9

6代码:https://wavegit.mipt.ru/Slavoch/mjx_sysid

4Fig.1.系统辨识步骤的结果:(上)使用默认参数的模拟机器人,随着时

0间逐渐倾倒。(中)真实机器人成功地以自然动作行走。(下)使用优化电机

.

8参数的模拟机器人,成功行走并紧密模仿真实机器人的动作。

0I.介绍

5

2A.我们的方法

:准确的仿真对于强化学习(RL)和基于优化的机

v在这项工作中,我们引入了一种新型的将新系统

i器人控制的成功至关重要[1]–[5]。这些控制策略的表

x

r现与仿真模型的真实度密切相关。实现这种真实性的识别步骤集成到强化学习训练循环中的控制框架(如

a

文档评论(0)

专业Latex文档翻译 + 关注
实名认证
服务提供商

专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。

1亿VIP精品文档

相关文档