- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
通过可微仿真基础系统识别实现精确可靠的运动
1111
VyacheslavKovalev,EkaterinaChaikovskaia,EgorDavydenko,andRomanGorbachev
Abstract—准确的系统识别对于减少双足行走中的轨迹漂
移至关重要,特别是在强化学习和基于模型的控制中。在本文motor
command
中,我们提出了一种将系统识别集成到使用可微分模拟的强化
学习训练循环中的新颖控制框架。与依赖直接扭矩测量的传统
方法不同,我们的方法仅使用轨迹数据(位置、速度)和控制输Problem:Deviationin
入来估计系统参数。我们利用可微分仿真器MuJoCo-XLA优sim-realrobottrajectory
化系统参数,确保模拟机器人的行为与现实世界的运动紧密一
致。该框架支持大规模且灵活的参数优化。它涵盖了质量、惯motor
性等基本物理属性。此外,通过神经网络近似处理复杂的系统command
本非线性行为,包括高级摩擦模型。实验结果表明,我们的框架
显著提高了轨迹跟踪性能。与基准强化学习方法相比,旋转偏
Success:Minimizingsim-
译差减少了75%,并且在命令方向上的行进距离增加了46%。realtrajectorydeviation
中
motor
1command
v补充材料+our
6approach
9
6代码:https://wavegit.mipt.ru/Slavoch/mjx_sysid
4Fig.1.系统辨识步骤的结果:(上)使用默认参数的模拟机器人,随着时
0间逐渐倾倒。(中)真实机器人成功地以自然动作行走。(下)使用优化电机
.
8参数的模拟机器人,成功行走并紧密模仿真实机器人的动作。
0I.介绍
5
2A.我们的方法
:准确的仿真对于强化学习(RL)和基于优化的机
v在这项工作中,我们引入了一种新型的将新系统
i器人控制的成功至关重要[1]–[5]。这些控制策略的表
x
r现与仿真模型的真实度密切相关。实现这种真实性的识别步骤集成到强化学习训练循环中的控制框架(如
a
您可能关注的文档
- 可调腿部刚度在单足跳跃机器人中用于跨越不同地面轮廓的高效 垂直跳跃.pdf
- PROV-AGENT:用于跟踪智能代理交互的统一来源记录.pdf
- 安全的毫米波波束成形配合主动 ISAC 防御对 抗波束窃取攻击.pdf
- 用于放射学视觉问题回答中复杂推理的多智能体系统.pdf
- 代理隐私保护机器学习.pdf
- 从 B 细胞进化中学习:通过在线优化进行抗体设计的自适应多专家扩散.pdf
- 阐明特征规范化在 IJEPA 中的作用.pdf
- 从 Wi-Fi 信道状态信息中提取移动目标的范围-多普勒信息.pdf
- 认知循环通过原位优化:科学的自适应推理.pdf
- 合成医学数据生成:现状及在创伤机制分类中的应用.pdf
- 查询属性建模:通过语义搜索和元数据过滤提高搜索相关性.pdf
- 雕塑家:通过主动上下文管理赋予大语言模型认知代理能力.pdf
- VirT-Lab: 一个用于灵活、可定制和大规模团队模拟的人工智能系统.pdf
- 轻量级变压器用于零样本和微调文本到 SQL 生成使用 Spider.pdf
- 可重复、可扩展的自回归模型文献合成管道.pdf
- 神经形态网络安全与半监督终身学习.pdf
- 多语种环境下面部-语音关联(FAME)2026 挑战评估 计划.pdf
- 视觉偏见与深度学习在皮肤影像分析中的可解释性.pdf
- CONVERGE:一种用于 xApps 的多智能体视觉-无线电架构.pdf
- LA-CaRe-CNN:级联细化 卷积神经网络用于左心房疤痕分割.pdf
最近下载
- (上课用)第四讲 增词译法和省词译法.ppt VIP
- 2025年公务员初任网络培训考试试题(附答案+解析).docx VIP
- 【2025秋季新修订教材】统编语文三上第七单元《单元整体设计 20 古诗三首》公开课一等奖创新教学设计.docx VIP
- 《危险化学品企业安全生产标准化通用范》GB 45673-2025 学习.pptx VIP
- 《先进功能材料》课件.ppt VIP
- 建标106-2021 中医医院建设标准.pdf VIP
- T_ZLDX 001-2023 中国老年大学(学校) “游学养”建设与评价规范.docx VIP
- 金属压铸毕业设计 汽车发动机外壳金属压铸模具.pdf VIP
- 郑成功教学课件.ppt VIP
- 《照明线路的安装与检修》学习任务设计方案5教室照明电路的安装与检修学习任务设计方案.pdf VIP
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
原创力文档


文档评论(0)