- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于强化学习的类人机器人步行参数学习的类人机器人步行参数学习
第38 卷 第8 期 计 算 机 工 程 2012 年4 月
Computer Engineering April 2012
Vol.38 No.8
文献标识码文献标识码::A
文献标识码文献标识码:: 中图分类号中图分类号::TP18
文章编号文章编号::1000——3428(2012)08——0013——03 中图分类号中图分类号::
·博士论文·博士论文·· 文章编号文章编号:: —— —— ——
··博士论文博士论文··
基于基于强化强化学习的类人机器人步行参数学习的类人机器人步行参数训练算法训练算法
基于基于强化强化学习的类人机器人步行参数学习的类人机器人步行参数训练算法训练算法
梁志伟梁志伟 1,2 ,朱松豪,朱松豪 1
梁志伟梁志伟 ,,朱松豪朱松豪
(1. 南京邮电大学自动化学院,南京 210046 ;2. 东南大学复杂工程系统测量与控制教育部重点实验室 ,南京 210096)
摘摘 要:要 :基于轨迹规划的类人机器人在合理的参数组合下可实现快速稳定的行走。为优化步行参数 ,提出一种基于强化学习的步行参数训
摘摘 要要 ::
练算法。对步行参数进行降阶处理,利用强化学习算法优化参数 ,并设置奖惩机制。在 Robocup3D 仿真平台上进行实验,结果证明了该算
法的有效性。
关键词关键词:类人: 机器人 ;步行参数;强化学习;奖惩机制
关键词关键词::
Walking Parameters Training Algorithm of Humanoid Robot
Based on Reinforcement Learning
1,2 1
LIANG Zhi-wei , ZHU Song-hao
(1. College of Automation, Nanjing University of Posts and Telecommunications, Nanjing 210046
2. Key Lab of Measurement and Control of Complex Systems of Engineering, Ministry of Education, Southeast University, Nanjing 210096, China)
【【Abstract 】】Aiming at optimizing walking parameters for quick and stable walking of humanoid r
您可能关注的文档
- 低偏压分子电子器件的电导规律.pdf
- 低压下co2在氨基聚离子液体中的吸附.doc
- 低voc雾化及气味-nowconnect-trinseo.pdf
- 低成本无团聚纳米氧化锌的制造-云南大学.pdf
- 低功耗数字温度传感器-德州仪器.pdf
- 低能耗无线传感器网络路由算法.pdf
- 住房公积金制度的公平缺失与调整.pdf
- 体育局开展深入学习实践科学发展观活动整改落实-温州体育中心.doc
- 作业场所职业病危害申报表填报说明-庄河.doc
- 低浓度羟丙基胍胶压裂液在苏里格气田的应用-天然气与石油.pdf
- 基于信令消息的volte接续时延优化.pdf
- 基于总体势减小的动态调度技术解决多机器人的路径规划ξ.pdf
- 基于感知数据概率模型的无线传感器网络采样和通信调度-计算机应用.pdf
- 基于感官分析的香水挥发模型-厦门大学学报自然科学版.pdf
- 基于强化学习的异构无线网络资源管理算法-电信科学.pdf
- 基于强化学习的相关反馈图像检索算法-计算机工程与应用.pdf
- 基于损伤本构模型的钢梁局部屈曲临界状态分析-钢结构.pdf
- 基于推测的无晌应任务自适应容错调度算法-计算机科学.pdf
- 基于改进智能水滴算法的双资源约束车间调度-浙江工业大学学报.pdf
- 基于效用epon分布式动态带宽分配实现机制-citeseerx.pdf
文档评论(0)