CN119512184A 基于约束奖励的深度强化学习四足机器人运动控制方法及系统 (清华大学).docxVIP

  • 1
  • 0
  • 约1.58万字
  • 约 26页
  • 2026-05-08 发布于山西
  • 举报

CN119512184A 基于约束奖励的深度强化学习四足机器人运动控制方法及系统 (清华大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119512184A

(43)申请公布日2025.02.25

(21)申请号202510082218.4

(22)申请日2025.01.20

(71)申请人清华大学

地址100084北京市海淀区清华园

(72)发明人贾理淦匡敏驰周联盟张晨何世玉孔永昌

(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201

专利代理师白雪静

(51)Int.Cl.

G05D1/49(2024.01)

G05D109/12(2024.01)

权利要求书2页说明书9页附图3页

(54)发明名称

基于约束奖励的深度强化学习四足机器人

运动控制方法及系统

(57)摘要

CN119512184A本发明公开了一种基于约束奖励的深度强化学习四足机器人运动控制方法及系统,建立四足机器人深度强化学习的仿真训练环境;确定仿真训练环境的奖励函数、域随机化参数和成本约束函数;基于机器人信息和第一模拟环境信息,在仿真训练环境中通过奖励函数和成本约束函数对初始策略网络模型进行训练,得到训练完成的策略网络模型;建立推理测试环境,并将训练完成的策略网络模型部署至推理测试环境进行模型推理测试调优,得到目标策略网络模型;将目标策略网络模型部署至四足机器人中,以对四足机器人进行运

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档