第六章球员智能体体系结构.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章球员智能体体系结构

WrightEagle 第六章 球员智能体体系结构 本章主要介绍 RoboCup 仿真机器人足球比赛几年来典型的球队,从中可以看到仿真机 器人足球的发展。 6.1 CMUnited 美国卡耐基梅隆大学仿真球队 CMUnited 仿真球队由美国卡耐基梅隆大学研制,蝉联 1998、1999 年两届 RoboCup 仿 真组冠军,后来的球队很多都是在该队源码的基础上改进发展出来的。 CMUnited 球队的体系结构如图 1 所示,将世界模型分为直接对应外部世界的世界状态 模块(World State )和记录球员内部信息的内部状态模块(Internal State ),相应的球员的 行为也分为改变外部世界的外部行为模块(External Behaviors )和改变内部状态的内部行为 模块(Internal Behaviors ),而更衣室协定模块(Locker-Room Agreement )用来制定合作、 通讯等指导团队行为。 • 图1 CMUnited 仿真球队体系结构图 6.2 FCPortugal 葡萄牙仿真球队 FC Portugal 的球队策略包括战术,阵型,球员类型,形势,智能通讯和感知策略和敌 方建模策略。这些结构是由一位人类教练根据对手球队特性首先提出的。 WrightEagle 图2 :智能体结构和高层决策模型的控制流程 智能体的主要控制循环使用感知解释和动作预测来更新世界模型〔9 〕,然后使用高层 决策模型来决定下一步的动作。FC Portugal 的信息模型是一个四层结构的数据模型: 全局形势信息 - 高层信息比如比分、时间、比赛策略(射门,成功传球,控球等)和 对方行为,用来确定每一时刻的战术; 形势信息 - 和阵型选择相关的信息,和 SBSP,SLM(Strategic Looking Mechanism 策 略上的观测机制)和ADVCOM(Intelligent Communication Mechanism 智能通讯机制)机制相关 的信息; 动作选择信息 - 一套高层参数,用来确定动态形势,选择适当的控球或开球行为; 世界状态 - 底层信息,包括球员和足球的位置和速度。 高层决策模型不仅决定了球员动作,而且决定了战术、阵型、站位和每一时刻的球员类 型。这个高层决策模型(图 2 )初始化以下内部结构后,进入智能体的主控制循环。这个循 环通过允许 STARTEGY 模型开始,智能体使用比赛的全局信息确定当前战术,使用形势信 息来确定阵型。然后,智能体分析 DPRE (Dynamic Positioning and Role Exchange动态 站位和角色变换)的可能性,执行智能通讯分析和策略观测模型。如果进而死球情况,执行 死球比赛站位。如果活动形势没有被确定,就表明智能体不需要马上进而活动行为,执行 SBSP (Situation Based Strategic Positioning 基于形势的策略站位)。如果形势是活动的,而 且智能体是控球的,就会选择一个恰当的控球动作,否则就会选择一个恰当的开球防守动作。 还有不是决策部分的构成了循环:动作执行和多层世界状态更新。 6.3 TsinghuAeolus 中国清华大学仿真球队[chenjbs] 在 RoboCup 仿真环境中,由于状态空间过于庞大以及反馈延迟过大,不融入任何先验 知识的决策设计很难取得良好的效果。即使对于一些非常简单的概念如带球、截球、射门、 传球等,要让智能体自动地从与环境的交互中总结出来并组织成可用的知识,将是十分困难 的。从人类自身获取知识的实际情况来看,通过教学活动所获得的知识占了很大的比例。基 于以上考虑,TsinghuAeolus 队认为,一个融入人类的先验知识并且能在一定程度上自主学 习的决策系统,是一个有价值而且可行的设计目标。Tsinghua 队主要利用“框架”和“建议” WrightEagle 的形式表达相关的人类知识。比如,人类往往自然而然地把决策分解为进攻和防守,如果还 有点足球知识的话,可以更细致地分解为带球、截球、传球、射门等等。在 Tsinghua 队的 决策体系中,这些概念都是事先假定的,也就是以所谓框架的形式存在

文档评论(0)

ldj215323 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档