基于二进制粒子群的救援仿真机器人决策.pdfVIP

基于二进制粒子群的救援仿真机器人决策.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 29卷 第 2期 广西师范大学学报 :自然科学版 Vo1.29 No.2 2011年 6月 JournalofGuangxiNormalUniversity:NaturalScienceEdition Jun.201l 基于二进制粒子群的救援仿真机器人决策 刘 炜,王 浩,方宝富 (合肥工业大学计算机与信息学院,安徽 合肥 230009) 摘 要 :救援仿真机器人系统中的智能体决策过程是在复杂的多任务环境下寻找一组最优的任务率先执行。 本文将二进制粒子群优化算法用于救援仿真机器人的决策过程中。通过对救援仿真机器人的任务进行评价, 并且使用带惯性的粒子迭代方式产生最优执行方案。经过RoboCup—Rescue仿真系统测试,救援效果得到了 提升。 关键词 :智能机器人;多智能体协作;二进制粒子群优化算法;救援仿真机器人 中图分类号 :TP18 文献标识码 :A 文章编号:1001—6600(2011)02—0130—04 救援仿真机器人系统 (RoboCuprescuesimulationsystem,RCRSS)是国际机器人赛事RoboCup基于 社会应急救助需求推出的一个模拟大规模城市灾难救援的仿真平台。其主要 目标是建立理性智能的搜救 和调度系统,并在灾难来临时,使社会损失尽可能减少到最低[1]。RCRSS是一个 c/s架构的分布式系统, 它提供了具备不同功能的异构智能体,智能体之间相互协作的关系使得救援仿真机器人系统是一个典型 的多智能体协作系统 ]。目前针对救援仿真机器人研究中的多智能体协作问题,东南大学采用了基于中心 调控的人工免疫方法 ],但抗体和抗原的选择不够充分,只能完成部分智能体的协作。土耳其的海峡大学 采用了拍卖机制[4],但是当拍卖规模较大时则处理不好。加兹温伊斯兰阿扎德大学的机电一体化研究实验 室采用了线性加权方法[5],该方法使用一个通用的效果评价模型,使得评价结果存在差异。由于智能体在 决策时既要考虑 自身的任务,又要考虑其他异构智能体的协作任务,在复杂的多任务环境下智能体需要找 到一组最优的任务率先执行从而获得更好的救援效果。本文将智能体决策过程视为一个多 目标的优化问 题,针对这一多维离散型优化问题,采用二进制的粒子群优化方法完成[6]。 1 粒子群优化算法 I.1 基本的粒子群优化算法 Kennedy和 Eberhart于 1995年提出的粒子群优化算法(particleswarmoptimization,PSO)是基于群 体的演化算法,其思想来源于人工生命和演化计算理论L7]。PSO算法中,每个粒子对应 一个待优化问题 的潜在解 。粒子 尸有 自己的位置和速度 ,分别表示为 Ⅳ维矢量 =( ,.72 …,Ⅳ)和V一( ,72 …, WiN)。X对应的目标函数值称为粒子的适应值 , 决定粒子运动的方向和距离。粒子 尸始终记忆 自身 目 前找到的最优解 ,称为个体极值 pbest。整个群体的最优解,称为全局极值 gbest。PSO算法初始随机生成 一 群粒子,然后通过迭代求解。迭代终止的条件为预先确定的最大迭代次数或者满足优化结果的精度要 求。在第k次迭代,粒子P按照如下两式来更新 自己的速度和位置: 一口+c1rand1(户best一z)+f2rand2(gbest;一硝), (1) z = ,+ , (2) 其中,C和f是学习因子,通常取c一c。一2;rand和rand。是介于(o,1)之间的随机数; 和硝分别是粒 子P在第志次迭代中第 维的速度和位置,两者均被限制在一定的范围内;pbest~是粒子尸在第J维的 个体极值;gbest是群体在第 维的全局极值的位置[8]。 收稿 日期:2011-05—08 基金项 目:国家 自然科学基金资助项 目 通讯联系人:王浩 (1962一),男.江苏泰州人,合肥工业大学教授。E—mail:jsjxwangh@hfut.edu.cn 第 2期 刘 炜等:基于二进制粒子群的救援仿真机器人决策 1.2 二进制粒子

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档