- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第卷第期计算机科学
468Vol.46No.8
年月
20198COMPUTERSCIENCEAu.2019
g
多智能体强化学习综述
,
杜威1丁世飞12
1
(中国矿业大学计算机科学与技术学院江苏徐州)
221116
2
(中国科学院计算技术研究所智能信息处理重点实验室北京)
100190
,,、、
摘要多智能体系统是一种分布式计算技术可用于解决各种领域的问题包括机器人系统分布式决策交通控制
.,、
和商业管理等多智能体强化学习是多智能体系统研究领域中的一个重要分支它将强化学习技术博弈论等应用到
,.
多智能体系统使得多个智能体能在更高维且动态的真实场景中通过交互和决策完成更错综复杂的任务文中综述
,,
了多智能体强化学习的最新研究进展与发展动态首先介绍了多智能体强化学习的基础理论背景回顾了文献中提出
,、()
的多智能体强化学习的学习目标和经典算法其被分别应用于完全合作完全竞争和更一般不合作也不竞争的任
.,,,
务其次综述了多智能体强化学习的最新进展近年来随着深度学习技术的成熟在越来越多的复杂现实场景任务
,,.
中研究人员利用深度学习技术来自动学习海量输入数据的抽象特征并以此来优化强化学习问题中智能体的决策
,,、、、
近期研究人员结合深度学习等技术从可扩展性智能体意图奖励机制环境框架等不同方面对算法进行了改进和
.,
您可能关注的文档
- 多智能体协同覆盖控制及其n在地灾监测中的应用.pdf
- 工业智能体使能机械装备数字化升级.pdf
- 面向智能体的语义通信架构与范例.pdf
- 异构多智能体联盟动态任务分配.pdf
- 《智能体构建与应用》理论题库 多选题100.docx
- 《智能体构建与应用》理论题库 判断题550.docx
- 《智能体构建与应用》赛项规程说明会.pptx
- 2024一带一路暨金砖大赛-大赛信息服务平台报名操作手册-20240716 (1).pdf
- BRICS2024-ST-148 2024一带一路暨金砖大赛之智能体构建与应用赛项技术规程.pdf
- BRICS2024-ST-148-2024一带一路暨金砖大赛之智能体构建与应用赛项样题-A.pdf
- 项目经理/产品经理/咨询顾问-Kelly + 关注
-
实名认证服务提供商
会计从业资格证持证人
具备金融(银行,证券,保险,互金),物流,IT(甲方和乙方),贸易,电商,制造业(包括半导体和电子制造),咨询公司等行业工作经验。 多年IT行业项目经理,产品经理,咨询顾问,需求分析,质量保证等岗位工作经验。 调研报告,手册撰写,产品介绍,技术报告,总结报告,作文写作,公文写作,心得体会,品牌故事。 管理体系搭建,财务体系搭建,战略规划定制,建设方案定制,企业转型方案,行业分析报告,数据分析报告,培训计划方案,规章制度撰写,运营方案定制,商业计划书,可行性分析,话术定制。
文档评论(0)