第六章球员智能体体系结构.PDFVIP

下载本文档

5
0
约 6页
2017-07-28 发布于江苏
举报
版权申诉

第六章球员智能体体系结构.PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第六章球员智能体体系结构

WrightEagle 第六章球员智能体体系结构本章主要介绍 RoboCup 仿真机器人足球比赛几年来典型的球队，从中可以看到仿真机器人足球的发展。 6.1 CMUnited 美国卡耐基梅隆大学仿真球队 CMUnited 仿真球队由美国卡耐基梅隆大学研制，蝉联 1998、1999 年两届 RoboCup 仿真组冠军，后来的球队很多都是在该队源码的基础上改进发展出来的。 CMUnited 球队的体系结构如图 1 所示，将世界模型分为直接对应外部世界的世界状态模块（World State ）和记录球员内部信息的内部状态模块（Internal State ），相应的球员的行为也分为改变外部世界的外部行为模块（External Behaviors ）和改变内部状态的内部行为模块（Internal Behaviors ），而更衣室协定模块（Locker-Room Agreement ）用来制定合作、通讯等指导团队行为。 • 图1 CMUnited 仿真球队体系结构图 6.2 FCPortugal 葡萄牙仿真球队 FC Portugal 的球队策略包括战术，阵型，球员类型，形势，智能通讯和感知策略和敌方建模策略。这些结构是由一位人类教练根据对手球队特性首先提出的。 WrightEagle 图2 ：智能体结构和高层决策模型的控制流程智能体的主要控制循环使用感知解释和动作预测来更新世界模型〔9 〕，然后使用高层决策模型来决定下一步的动作。FC Portugal 的信息模型是一个四层结构的数据模型：全局形势信息－高层信息比如比分、时间、比赛策略（射门，成功传球，控球等）和对方行为，用来确定每一时刻的战术；形势信息－和阵型选择相关的信息，和 SBSP，SLM(Strategic Looking Mechanism 策略上的观测机制)和ADVCOM(Intelligent Communication Mechanism 智能通讯机制)机制相关的信息；动作选择信息－一套高层参数，用来确定动态形势，选择适当的控球或开球行为；世界状态－底层信息，包括球员和足球的位置和速度。高层决策模型不仅决定了球员动作，而且决定了战术、阵型、站位和每一时刻的球员类型。这个高层决策模型（图 2 ）初始化以下内部结构后，进入智能体的主控制循环。这个循环通过允许 STARTEGY 模型开始，智能体使用比赛的全局信息确定当前战术，使用形势信息来确定阵型。然后，智能体分析 DPRE （Dynamic Positioning and Role Exchange动态站位和角色变换）的可能性，执行智能通讯分析和策略观测模型。如果进而死球情况，执行死球比赛站位。如果活动形势没有被确定，就表明智能体不需要马上进而活动行为，执行 SBSP （Situation Based Strategic Positioning 基于形势的策略站位）。如果形势是活动的，而且智能体是控球的，就会选择一个恰当的控球动作，否则就会选择一个恰当的开球防守动作。还有不是决策部分的构成了循环：动作执行和多层世界状态更新。 6.3 TsinghuAeolus 中国清华大学仿真球队[chenjbs] 在 RoboCup 仿真环境中，由于状态空间过于庞大以及反馈延迟过大，不融入任何先验知识的决策设计很难取得良好的效果。即使对于一些非常简单的概念如带球、截球、射门、传球等，要让智能体自动地从与环境的交互中总结出来并组织成可用的知识，将是十分困难的。从人类自身获取知识的实际情况来看，通过教学活动所获得的知识占了很大的比例。基于以上考虑，TsinghuAeolus 队认为，一个融入人类的先验知识并且能在一定程度上自主学习的决策系统，是一个有价值而且可行的设计目标。Tsinghua 队主要利用“框架”和“建议” WrightEagle 的形式表达相关的人类知识。比如，人类往往自然而然地把决策分解为进攻和防守，如果还有点足球知识的话，可以更细致地分解为带球、截球、传球、射门等等。在 Tsinghua 队的决策体系中，这些概念都是事先假定的，也就是以所谓框架的形式存在