- 1
- 0
- 约2.76万字
- 约 10页
- 2026-03-09 发布于北京
- 举报
巴洛行走:适用于腿部机器人地形自适应运动的自我监督表示
学习
HaodongHuang,ShilongSun,YuanpengWang,ChiyaoLi,HailinHuang,WenfuXu
Abstract—强化学习(RL),由数据驱动方法推动,已成
为解决机器人腿部运动控制问题的有效方案。然而,双足机器
人地形穿越的主流RL方法,如师生策略知识蒸馏,受到长时
间训练的影响,限制了开发效率。为了解决这一问题,本文提
出了BarlowWalk,一种结合自监督表示学习改进的近端策略
优化(PPO)方法。该方法采用BarlowTwins算法构建解耦
潜空间,将历史观察序列映射到低维表示并实现自我监督。同
本时,演员仅需本体感觉信息即可在连续时间步骤中实现自监督
译学习,显著降低了对外部地形感知的依赖性。仿真实验表明,这
种方法在复杂地形场景下具有明显优势。为了增强评估的可信
中度,本研究通过比较测试将BarlowWalk与先进算法进行对
1比,实验证明了所提出方法的有效性。
vFig.1.实验中使用的机器人是来自LimxDynamics的TRON1。
9
3I.介绍
9
0人类通过双足结构展现了对复杂地形的惊人适应[14],为实时、自适应的运动控制提供了新的途径。
0.能力,但在多足机器人中实现类似的步态控制仍然是当前主流的双足机器人强化学习方法大多依赖于
8
0一个重大挑战。基于传统模型的方法通过利用运动学特权学习方法[15]。然而,在现实世界场景中,机器人
5和动力学原理[1],[2],[3],[4],[5],[6],[7],[8]取得了有希望通常无法获取显式的地形信息,必须仅根据本体感觉
2
:的结果。然而,这些方法在平衡模型准确性与计算效输入来做出决策。因此,这种交互通常被建模为部分
v
i率方面常常遇到困难,特别是在实时控制场景中。此可观测马尔可夫决策过程(POMDP)。为了应对部分
x
r外,它们需要深入了解机器人的动力学特性,这不仅提可观测性问题,现有研究通常采用以下方法之一:(1)
a
高了技术门槛,也限制了领域专业知识较少的研究人将地形信息输入到强化学习的评判网络中,使其能够
员的广泛参与。近年来,基于强化学习(RL)的方法已通过学习地形感知的价值估计来隐式引导策略;或者
成为一个重要的研究方向。通过利用仿真环境和特定(2)采用师生框架,在该框架中具有访问地形权限的教
任务的奖励函数,RL使机器人能够自主获得复杂的运师策略将知识传递给仅依赖本体感觉的学生策略[16]。
动技能,而无需进行显式建模[9],[10],[11],[12],[13],许多研究利用仿真中的完全可观测性来促进这些范式
的训练。
HaodongHuang,ShilongSun,YuanpengWang,Chiyao在四足机器人研究中,由四条腿结构提供的内在
Li,HailinHuangandWenfuXuarewithSchoolofRobotics稳定性使得某些研究能够仅使用当前和最近的本体感
andAdvancedManufacture,HarbinInstituteofTechnology,
Shenzhen,518052,China(Correspondingauthor:ShilongSun)觉信息作为输入[17]实现复杂地形上的运动。相比之
hhd1340201839@163.com,sunshilong@,下,由于结构上支撑的限制,双足机器人在保持平衡
qq1226171844@126.com,lcy_51k@163.com,huanghailin@
您可能关注的文档
- SBP-YOLO: 一种用于检测减速带和坑洞的轻量级实时模型.pdf
- StyleSentinel: 通过风格指纹实现可靠的艺术版权验证.pdf
- AffectGPT-R1:利用强化学习进行开放词汇情感识别.pdf
- GMAT: 基于多智能体的临床描述生成以供文本编码器在视觉语言 MIL 中用于全幻灯片图像分类.pdf
- 关于宽带 ODDM 系统中多普勒斜视的特征与评估.pdf
- ModelNet40-E:一个面向点云分类的不确定性感知基准测试.pdf
- 通过对抗引导课程采样增强基于扩散的数据集蒸馏.pdf
- SketchAgent:从手绘草图生成结构化图表.pdf
- 具有风险保证的故障检测中的校准预测集通过显著性检验.pdf
- 展示了联网和自动驾驶车辆在网络安全、安全性和隐私问题方面的标准和方法.pdf
最近下载
- 2026年考试题光谱分析基础理论知识测试题库.docx VIP
- 怎样把交流电变成直流电.ppt VIP
- 吹膜新员工安全培训课件.pptx VIP
- 2026年湖南财经工业职业技术学院单招职业技能测试题库附答案详解.docx VIP
- 建筑施工技术说课课件.ppt VIP
- 绿色清新模板.ppt VIP
- 2026年绵阳市国资委社会化招聘机关工作人员的备考题库及答案详解一套.docx VIP
- 国家建筑标准设计图集22G101-3 混凝土结构施工图平面整体表示方法制图规则和构造详图(独立基础、条形基础、筏形基础、桩基础).pdf VIP
- 2026年常州工业职业技术学院单招职业适应性测试题库带答案解析.docx VIP
- 斜拉桥异形钢主塔竖向转体施工工法.pdf VIP
原创力文档

文档评论(0)