[信息与通信]RoboCup仿真中的分布式智能决策与优化学习.doc

[信息与通信]RoboCup仿真中的分布式智能决策与优化学习.doc

  1. 1、本文档共84页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[信息与通信]RoboCup仿真中的分布式智能决策与优化学习

RoboCup仿真中的分布式智能决策与 优化学习 Distributed Intelligent Decision and Optimized Learning in RoboCup Simulation 学生姓名: 马 洁 所在专业: 计算机科学与技术 指导教师: 张 志 涌 教 授 2005年6月3日 目 录 摘 要 4 ABSTRACT 5 第一章 背景介绍 6 1.1 引 言 6 1.2 多智能体系统 7 1.3 对抗性多智能体 9 1.4 RoboCup仿真平台介绍 10 1.5 RoboCup仿真的软件构成 12 1.6 RoboCup仿真中的Client模型 14 1.6.1 Client感知模型 14 1.6.2 Client的动作模型 18 1.7 RoboCup仿真平台的发展与研究趋势 22 1.7.1 Online Coach 22 1.7.2 Keepaway模式 24 1.7.3 3D比赛 24 第二章 多智能体的分层决策结构 25 2.1多智能体的各种结构模型 25 2.2多智能体的分层决策结构 26 2.3分层决策结构框架逻辑模型 27 第三章 RoboCup中多智能体的个体技术 31 3.1 问题综述 31 3.2 截球技术 32 3.2.1问题介绍 32 3.2.2牛顿迭代法解决截球问题 33 3.2.3牛顿迭代法的弊端和改进方法 36 3.3 带球技术 37 3.3.1 问题介绍 37 3.3.2 传统的解决方法 38 3.3.3 本文的带球算法 40 第四章 动态世界模型 48 4.1背景介绍 48 4.2 动态世界模型的信息融合 48 4.3 RoboCup中基于相对环扇的几何跟踪法 51 第五章 选择性信息共享 53 5.1 多智能体系统中的信息共享 53 5.2 选择性信息共享 53 5.3 选择性信息共享在RoboCup中的应用 54 5.3.1信息压缩编码与解码 54 5.3.2信息选择 55 5.3.3 Attention策略 55 第六章 在线对手建模 57 6.1 对抗性多智能体系统需要对手建模 57 6.2 在线对手建模 58 6.3 在RoboCup中的应用举例 59 第七章 建议机制 61 7.1 背景研究 61 7.2 建议机制流程 62 7.3 实验总结 64 第八章 多智能体集团性协同战略战术 66 8.1 问题的提出 66 8.2 战略战术的描述 66 8.3 战术的执行与合作的产生 68 8.4 战术的自适应调整 71 8.5 RoboCup中的应用举例 71 8.6 战术执行效果及测试 73 结论 74 致谢 75 参考文献 76 附录1 :Team Description of Apollo 80 附录2 :本课题研究在RoboCup比赛中所获荣誉及证书 83 摘 要 随着人工智能理论在军事对抗和国民生产中的各个领域的广泛运用,多智能体已成为智能控制的研究热点。诸多问题的解决都需要多智能体系统(MAS)的出现,如:多弹头导弹的攻击与拦截,集群式作战机器人,多智能体坦克系统,电网调度系统,交通控制,网络路由的智能控制,集群搜索与探查机器人,医用集群式机器人,智能型电脑游戏等。因此多智能体系统的研究是当今世界上的迫切课题。 在各种多智能体系统中,对抗性多智能体系统的分布式决策是亟待解决的技术难点之一。其研究的核心在于实时、异步、有噪声的对抗环境下,多个智能体自主决策相互配合,实现单个智能体无法完成的对抗目标。在该领域,世界上还没有形成一个完整的科学体系。尤其在全局利益表示、带噪对抗环境下多智能体分布式决策方法、多智能体对手识别与对手建模、在线战术的生成与指导方面,一直是国内外科研工作者的技术难题。 RoboCup即机器人世界杯足球锦标赛,是国际上对抗性多智能体标准的验证平台。本文研究了RoboCup仿真中多智能体对抗系统的分布式自主决策问题,描述了智能体对抗系统中的技术难点和问题特性。针对这些问题,本文设计出了一套完整的多智能体实时分层决策结构。世界模型在多智能体对抗系统的分布式决策与智能协作中发挥着举足轻重的作用。本文采用粒子滤波器实现了噪声环境下的位置状态更新、信息融合、动态世界模型的维护,为上层决策提供依据。 为提高群体智能决策能力,本文提出了建议机制和集团性协同战略战术方法。本文用一套战略战术语言,在离线环境下组建对手模型的结构特征库,并提出了对手模型的自适应辨识方法和共享信息的择优机制,对特征库中的特征信息进行合作性在线调整,生成实时的反制指导。 RoboCup比赛中获得的优异成绩证明本文提出的研究方法与理论具有良好的对抗决策性能。 关键词:多智能体,在线对手建模,战术提议,建议机制,

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档