张等 - Q学习演化博弈中决策机制对网络合作水平的影响(1).pdfVIP

下载本文档

7
0
约4.05万字
约 13页
2023-09-06 发布于上海
举报
版权申诉

张等 - Q学习演化博弈中决策机制对网络合作水平的影响(1).pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

计算机工程 Computer Engineering ISSN 1000-3428,CN 31-1289/TP 《计算机工程》网络首发论文题目： Q 学习演化博弈中决策机制对网络合作水平的影响作者：张尊栋，王岩楠，周慧娟，张艺帆 DOI ： 10.19678/j.issn.1000-3428.0064463 网络首发日期： 2022-09-22 引用格式：张尊栋，王岩楠，周慧娟，张艺帆．Q 学习演化博弈中决策机制对网络合作水平的影响[J/OL]．计算机工程. /10.19678/j.issn.1000-3428.0064463 网络首发：在编辑部工作流程中，稿件从录用到出版要经历录用定稿、排版定稿、整期汇编定稿等阶段。录用定稿指内容已经确定，且通过同行评议、主编终审同意刊用的稿件。排版定稿指录用定稿按照期刊特定版式（包括网络呈现版式）排版后的稿件，可暂不确定出版年、卷、期和页码。整期汇编定稿指出版年、卷、期、页码均已确定的印刷或数字出版的整期汇编稿件。录用定稿网络首发稿件内容必须符合《出版管理条例》和《期刊出版管理规定》的有关规定；学术研究成果具有创新性、科学性和先进性，符合编辑部对刊文的录用要求，不存在学术不端行为及其他侵权行为；稿件内容应基本符合国家有关书刊编辑、出版的技术标准，正确使用和统一规范语言文字、符号、数字、外文字母、法定计量单位及地图标注等。为确保录用定稿网络首发的严肃性，录用定稿一经发布，不得修改论文题目、作者、机构名称和学术内容，只可基于编辑规范进行少量文字的修改。出版确认：纸质期刊编辑部通过与《中国学术期刊（光盘版）》电子杂志社有限公司签约，在《中国学术期刊（网络版）》出版传播平台上创办与纸质期刊内容一致的网络版，以单篇或整期出版形式，在印刷出版之前刊发论文的录用定稿、排版定稿、整期汇编定稿。因为《中国学术期刊（网络版）》是国家新闻出版广电总局批准的网络连续型出版物（ISSN 2096-4188 ，CN 11-6037/Z ），所以签约期刊的网络版上网络首发论文视为正式出版。网络首发时间：2022-09-22 09:39:37 网络首发地址：/kcms/detail/31.1289.tp1539.011.html 计算机工程 Computer Engineering 本文源代码链接：/NCUTwyn/EC0064463.git Q 学习演化博弈中决策机制对网络合作水平的影响 1,2 1 1 3 张尊栋，王岩楠，周慧娟，张艺帆 (1. 北方工业大学城市道路交通智能控制技术北京市重点实验室, 北京 100144；2. 华盛顿大学智能城市交通系统实验室, 美国 20052 ；3. 北京交通大学轨道交通控制与安全国家重点实验室, 北京 100044) 摘要：在网络演化博弈中, 很多机制能够促进“ 囚徒困境”博弈中个体的合作,例如个体的策略选择机制, 收益矩阵的异质性以及个体的全局属性等. 随着机器学习的发展, 强化学习不需要对环境建模并能在个体与环境的相互作用中选择最优策略的特点使其逐渐被应用到复杂网络演化博弈领域中. 针对博弈决策过程中个体面临无法获取邻居收益的问题,基于Q 学习自我经验学习的特性，提出了Q 学习演化博弈模型. 考虑到不同Q 学习决策机制会对网络合作水平产生不同的影响, 本文采用了三种决策机制-greedy

您可能关注的文档

文档评论（0）

sdafsadfs + 关注: 实名认证

文档贡献者

咨询Ta 进入空间

1亿VIP精品文档

更多 >

张等 - Q学习演化博弈中决策机制对网络合作水平的影响(1).pdfVIP