同质群体33对称博弈的复制动态系统.docxVIP

下载本文档

8
0
约8.88千字
约 9页
2023-10-27 发布于广东
举报
版权申诉

同质群体33对称博弈的复制动态系统.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

同质群体33对称博弈的复制动态系统在运用经典游戏理论来解决现实问题时，经济学家往往会得出结论，这主要是因为传统的理性方法在理论和实践上存在许多缺陷。对决策者的理性要求非常高，在现实生活中往往很难实现，导致理论结论与现实严重分离。经典博弈理论在新古典经济学框架的基础上引入了博弈方之间经济行为互动,所以无法解决“经济人”完全理性的假设,即博弈方对整个博弈结构和对方支付有着完全的了解。特别地,还要求这种理性是所有参与人的“共同知识”,然而现实生活中这种“完全理性”的人根本不存在。博弈方具有有限理性,意味着博弈过程中博弈方不可能通过一次博弈就能找到获得最大利益的最优策略,而是通过在多次重复博弈过程中的不断学习、模仿,寻找一个较好的策略。该学习过程也就是一个策略的动态调整过程。在研究有限理性博弈方学习和策略调整的过程中,人们发现可以利用生物进化的动态机制进行模拟,并提出了与生物进化博弈非常相似的“进化稳定策略”概念。一般进化博弈模型主要基于两个方面建立:选择和突变,即生物进化过程中不同种群的优胜劣汰和某些个体基因突变。有限理性的博弈方重复博弈的过程也是一个学习和选择的过程,博弈方通过不断的学习和模仿调整策略,让自身利益能够得到改善,使最终的结构达到一个动态的均衡;同时,“进化稳定策略”还要求这种均衡可以“驱逐入侵者”,也就是说只要群体的策略达到一个稳定的均衡,即便有少部分的“变异者”开始改变策略,可最终这部分参与者会通过不断的学习、调整,使其决策恢复到原先的策略均衡上,该平衡状态下的策略称为进化稳定策略。由于博弈方理性和信息的有限,策略的调整过程难免会缺乏远见,但是基于不对称的信息来说,这种局部的、短视的决策却有着自身的合理性。运用动态复制系统模拟策略的动态调整过程已被大多数学者所采用。文献中研究了一类两种群生物复制动态系统,得出了此系统的帕累托最优解正是这个复制动态系统的稳定解。文献中考虑了具有n(n=2,3)个博弈方的具体复制动态系统,并讨论了其平衡点的分支情况。文献中分析了在连续策略空间条件下,复制动态系统演化到稳定结构的条件。对于动态复制系统的研究需要利用动力系统的理论和方法,但是一般的动态复制系统都是非线性的,分析较为困难,所以上述文献仅仅只是讨论了一些具体的系统。即便是简单的不完全信息情形下的重复博弈,其结构依然局限于具有对称支付矩阵的情况,并且研究结果仅限于个案分析和实验结果,对于2×2 重复博弈,文献中给出了较为完整的结果。本文利用动力系统相关理论、方法分析同质两群体3×3对称博弈的演化均衡的稳定性,对其动力学行为给出了完整的结论。 1 a+ye,be 对一般同质两群体3×3对称博弈的复制动态系统进行分析。对于3×3对称博弈的得益矩阵式,可以用图1表示,其中,x、y和1-x-y分别表示此类参与人在一次博弈中采取策略A、B、C的概率。显然,采用策略A、B、C时博弈方的期望得益分别为 E(A)=xa+yd+(1-x-y)fE(B)=xe+yb+(1-x-y)mE(C)=xg+yn+(1-x-y)cE(A)=xa+yd+(1?x?y)fE(B)=xe+yb+(1?x?y)mE(C)=xg+yn+(1?x?y)c 故整个群体的平均期望得益为 ˉE=x?E(A)+y?E(B)+(1-x-y)?E(C)Eˉˉˉ=x?E(A)+y?E(B)+(1?x?y)?E(C) 由于讨论的是群体之间的博弈行为,假设一个群体是一个博弈方,故其策略调整过程不会像一个具有快速学习能力的小组那样能够用“最优反应动态”这样的机制进行模拟,而是利用起源于生物学领域中生物进化的“复制动态”进行机制模拟。即如果有一个策略的得益大于群体均值,即便该策略未必是全局最优,也会使得选择该策略群体的份额增长。这就意味着该策略转变是一种渐进的过程,同时也说明该群体是一个学习速度较慢的有限理性博弈方。这样就解决了研究群体决策时,对理性的要求都特别基本的问题,从而摆脱了传统博弈论对博弈方完全理性假设的束缚,能够更加有效地解决有限理性博弈的问题。假设采用某一策略博弈方在整个群体中的比例的变化率与该策略博弈方的比例成正比,同时也与其期望得益超过平均的期望得益的幅度成正比,可以得到复制动态方程 dxdt=x[E(A)-ˉE]dydt=y[E(B)-ˉE]}(1)dxdt=x[E(A)?Eˉˉˉ]dydt=y[E(B)?Eˉˉˉ]}(1) 即动态复制系统: dxdt=(f-c)x+(a+2c-g-2f)x2+(d+2c-f-m-n)xy+(n+m-b-c)xy2+(f+g+m+n-2c-d-e)x2y+(f+g-a-c)x3dydt=(m-c)y+(b+2c-2m-n)y2+(e+2c-f-g-m)xy+(f+g-a-c)x2y+(f+g+m+n-2c-d-e)xy2+(