基于多智能体强化学习的机器人足球行为模型地研究.pdfVIP

基于多智能体强化学习的机器人足球行为模型地研究.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多智能体强化学习的机器人足球行为模型的研究· 李晓薇,程显毅,柯佳,韩兰君 (江苏大学计算机科学与通信学院,江苏镇江212013) 摘要:为完成一个团队的共同的目标,多智能体是如何学习的将是本文的研究目的。以机器人足球为背 景,基于强化学习建立多智能体学习模型,实验表明,与单智能体学习比较,多智能体学习具有明显的优势, 可以求解复杂的合作问题。 关键词:智能体;多智能体;强化学习;机器人足球 ReinforcementinThe of Multi——Agent LearningStudy ucoDoRledoI’—Soccer’sSoccerroivahe7SB eaviorMoel RobocuFI Li andHan Xiao-wei,ChengXian-yi,Ke-JiaLan-jun of ScienceCommunication (SchoolComputer Engineering,JiangSuUniversity,Zhenjiang 212013,China) Abstract:Theaimisthatresearch inordertofinish ateam will paper multi-agentslearning goal.Wepresent of amodel basedonreinforcement showthat with RoboCup learning,theexperiment single·agent Compared hasobvious itcansolvethe and learning,multi-agentlearning advantages,and complicatedcooperativeproblems. KeyWords:agent;multi·agent;reinforcementlearning;RoboCup 1 引言 由于Internet的使用,不分时间与地域地获得信息已成为现实,但是,如何有效利用这 些信息,并使用这些信息提高生产率成为迫切需要解决的问题。机器学习是解决这类问题的 有效方法之一。 在不同的时期,人们对机器学习有着不同的兴奋点。1989年,Carbonell发表文章【I】指 出机器学习有4个研究方向:连接机器学习、基于符号的归纳机器学习、遗传机器学习与分 析机器学习。十年过去了,1997年,Dietterich提出了另外4个新的研究方向:分类器的集 of for 成(Ensemblesclassifiers)、海量数据的有教师学习算法(Methodsscalingupsupervised learningalgorithm)、强化机器学习(Reinforcementlearning)与学习复杂统计模型(Learning stochastic complex models)。在理论上,我们可以将其进一步归纳为三类不同的学习理论:海 量数据的符号机器学习理论、统计机器学习理论与基于适应性的机器学习理论[21。 随着数字化和网络化进程的加快,带来了大规模、开放、异构、分布的信息资源,如何 学习变化的环境成为非线性学习的一个研究热点。 环境可分为三种类型:自然环境、社会环境与人的环境,这三类环境具有完全不同的性 质,分别研究这些环境的性质,并设计对变化环境适应的计算机制是机器学习的一项挑战性 的课题。

文档评论(0)

youyang99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档