智能机器人在动态未知环境中路径规划方法探寻.docVIP

下载本文档

9
0
约2.96千字
约 7页
2018-09-11 发布于福建
举报
版权申诉

智能机器人在动态未知环境中路径规划方法探寻.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

智能机器人在动态未知环境中路径规划方法探寻

智能机器人在动态未知环境中路径规划方法探寻　　摘要　　目前，智能机器人面对动态未知环境的避障及路径优化问题仍存在一定困难，而恰恰这方面的应用研究更具有实用价值，如灾难搜索营救、安保巡逻、家政服务、导游迎宾、餐饮服务等都要求机器人能够进行环境探测分析、主动避障和路径规划的能力。本文作者将强化学习的思想用于移动机器人在动态未知环境的路径规划中，结合改进的学习算法，实现机器人对运动障碍物的有效躲避，并通过仿真实验证实了该策略和算法的有效性。　　【关键词】智能机器人动态未知环境路径规划强化学习状态预测　　面对大多数实际工作环境，机器人不仅对空间信息做不到全局掌握，而且在工作环境中还存在随机移动的障碍物，这就需要工作机器人能对环境进行有效地探测，并做出合理的路径规划。因为对全局环境的不可预知，局部路径规划方法更适合于机器???在这种动态未知环境下使用，它只需要机器人获得较近的障碍物信息，避开对其安全行驶构成威胁的障碍物。通常情况下，机器人利用传感器反馈的信息实时规划出机器人的运动轨迹，这种方法可以处理环境中的不确定因素，实现在线路径规划。　　多数研究者认为要使机器人系统具有更大的潜能，其控制系统应具有学习能力，已经提出学习方法诸如神经网络、进化算法、强化学习以及它们的一些组合。其中，强化学习具有对复杂系统的自学习能力和较强的在线自适应性，在机器人研究中受到广泛的关注。将强化学习的理论及算法用于移动机器人环境探索中可以使控制系统具有良好的冗余性和鲁棒性。　　1 初始状态设置及环境模型　　本文讨论的初始机器人和障碍物均随机分布于工作环境中，且障碍物形状任意、数量有限。为了使问题简化，我们只考虑二维环境下机器人在运动方向正前方210°范围内的避障问题。沿运动方向在机器人周围对称安装7个超声波传感器（cs）和红外传感器（hs），感知范围分别是规划区和避障区，传感器布局如图1所示。如果机器人与障碍物的距离大于避障半径r，则机器人可以向目标点匀速直线移动；如果机器人与障碍物之间的距离小于r，则需要实施相应的避障策略。　　同时假定机器人能够在狭小的环境区域内自由转身而不会与障碍物相碰，因此在路径规划算法中不必考虑机器人的转动半径。　　以下是文中使用的参数：机器人与障碍物之间的距离；机器人与目标点间的距离；机器人运动方向与机器人到目标点间连线的夹角α；最小危险距离dmin，安全距离dmax。　　2 基于强化学习的移动机器人在规则运动动态障碍物环境中的路径规划　　2.1 运动障碍物的预测与模型　　当机器人在含有运动障碍物的环境中移动时，需要将运动障碍物t+Δt时刻的位置信息作为机器人规划路径的一个重要依据，所以我们首先要预测出运动障碍物在t+Δt时刻的位置信息，即状态预测，同时与路径规划方法相结合以解决含有运动障碍环境中的移动机器人路径规划问题。　　机器人通过传感器获得一系列按时间先后排列的离散的障碍物位置数据。对于规则运动的障碍物，当前时刻t的位置与时刻前的位置、……呈线性关系，所以障碍物位置坐标可以表示成式　　，其中均为未知待估参数，随着机器人不断运行中检测到的障碍物位置信息实时修正参数，得到运动障碍物未知的预测值。如果障碍物当前时刻的位置坐标为，相对运动速度沿X轴的分量为，沿Y轴的分量为，采样周期为，则障碍物下一时刻的预测位置坐标即为：。　　2.2 路径规划策略　　移动机器人在规则障碍物环境下进行准确路径规划的前提是能够对障碍物下一时刻的位置做出及时准确的预测，针对该问题，作者给出了相应的路径规划策略和流程图。　　智能机器人按时间周期采样当前状态，若没有检测到运动障碍物，则向目标点直线移动；若发现就要马上对障碍物在下一时刻的位置进行判断和预测，具体方法是：　　（1）当预测障碍物的位置与机器人运动方向的垂直距离大于安全距离时，则暂时不需要避障，机器人继续向目标点移动，否则就要实施一定的避障策略：当预测障碍物的位置与机器人运动方向的垂直距离介于时，根据障碍物的运动方向与机器人的运动方向的夹角决定机器人的下一步动作，是沿原运动方向移动？还是待障碍物离开避障区域后继续前进？还是调整一定角度后沿新方向继续移动。　　（2）当预测障碍物的位置与机器人运动方向的垂直距离小于dmin时则视为避障失败，机器人需要沿原路返回至安全区域重新选择动作。以上过程的流程图如图2所示。　　2.3 强化函数的设计　　考虑到障碍物的运动特性，我们将机器人的运动建立在一个坐标系上，β为动态障碍物的运动方向在该坐标系上的对应角度。因此，针对躲避动态障碍物的强化函数表示为：　　。移动机器人在规则运动障碍物环境下的强化信号函数设计主要考虑被预测的动态障碍物下一时刻的位置与机器人运动方向的垂直距