网站大量收购闲置独家精品文档,联系QQ:2885784924

基于资源协同演化的结构群体博弈动力学研究.pdfVIP

基于资源协同演化的结构群体博弈动力学研究.pdf

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

目录

摘要I

AbstractIII

第一章绪论1

1.1研究背景及意义1

1.2国内外发展现状2

1.3研究内容及创新点3

1.4论文组织架构4

第二章相关理论及方法5

2.1博弈论基础知识5

2.2演化博弈理论7

2.2.1演化博弈论7

2.2.2结构化群体中的博弈行为8

2.3本章小结9

第三章基于霍克斯过程的空间多博弈中的合作行为研究10

3.1引言10

3.2基本模型介绍10

3.3实验结果及分析13

3.4本章小结22

第四章强化学习背景下的空间多策略与有限资源的协同演化研究23

4.1引言23

4.2基本模型介绍23

4.3实验结果及分析25

4.4本章小结36

第五章总结与展望38

5.1研究内容总结38

5.2未来展望38

参考文献40

攻读硕士学位期间的主要成果46

致谢47

摘要

在现实社会当中,资源匮乏的情况并没有因为科技发展而得到有效改善。在社会中,

个体为了谋求生存或提高生存质量,需要通过相互竞争来获取更多的社会资源,这也导

致博弈行为无处不在。其中,可以为个体带来更多收益的背叛策略,看似成为理性个体

的“最佳”选择,但现实中无处不在的合作行为却与上述认知相违背。演化博弈论的出

现,为群体中合作行为的涌现及其演化规律研究提供了新方法。本文在结构化群体和有

限资源背景下,针对演化博弈各类策略的涌现机理、演化规律及其博弈动力学展开讨论

和研究,主要工作如下:

(1)基于单层方格网络,将霍克斯过程与多博弈模型相结合,使个体之间确定性博弈

行为转变为概率性事件,以模拟现实生活中博弈事件发生的不确定性,探讨了概率多博

弈模型的演化动力学行为。其中,将有限资源分配以协同演化方式引入到模型中,并设

定参与者的情绪机制。通过资源的分配影响个体情绪,进而作用于参与者博弈策略的选

择中,形成资源分配、个体情绪、多博弈策略的三者闭环模型。基于上述机制,分析有

限资源在结构化群体中的分布情况以及对不同群体中多博弈策略演化过程的影响差异,

并发现和讨论了由博弈的不确定性所引起的合作策略的相变现象。并且,研究发现基于

霍克斯过程的概率博弈模型相比经典博弈模型更有利于合作策略的生存和演化。

(2)强化学习方法与演化博弈具有追求序列行为收益最大化的理论共性。基于囚徒困

境博弈模型,使用自相关的Q-learning算法来决定参与者的策略更新,研究强化学习方法

引入后的博弈动力学行为。为提升模型中策略多样性,将“保守者”作为第三策略引入

到囚徒困境模型当中,对演化过程中多策略之间的相互影响进行分析。同时,引入有限

资源进行协同演化,并作为衡量博弈个体所处状态的重要因素以及保守者是否参与博弈

的判断条件,研究资源对策略演化过程的影响。进而,根据博弈个体拥有的资源数量划

分为不同群体,研究各群体中策略演化过程中的差异。研究发现强化学习的引入使智能

体的决策更兼顾时序性和环境影响,并且模型中存在的保守策略与合作行为具有一定共

生性,特定条件下能提升合作群体的生存性。

关键词:演化博弈;博弈动力学;有限资源;霍克斯过程;强化学习

分类号:TP18

Abstract

Intherealworld,thesituationofresourcescarcityhasnotbeeneffectivelyimproveddueto

technologicaladvancements.Insociety,individualscompetewitheachothertoacquiremore

socialresourcesinordertoseeksurvivalorimprovetheirqualityof

文档评论(0)

论文资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档