文献综述-Prisoners Dilemma 演化博弈中的自适应行为.docVIP

文献综述-Prisoners Dilemma 演化博弈中的自适应行为.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
毕业论文文献综述 理论物理 Prisoners Dilemma 演化博弈中的自适应行为 摘要:本文简要简绍了博弈理论、演化博弈理论以及复杂网络的基本概念和发展过程,介绍了囚徒困境模型以及此模型的研究进展和近年来的研究状况。最后提出了本人的研究方向。 关键词:“囚徒困境”、复杂网络、演化博弈、自适应 博弈论是指个人或组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并各自取得相应结果或收益的过程。现代博弈理论起源于数学家冯·诺依曼和经济学家摩根斯坦的合著《博弈理论和经济行为》,此著作奠定了现代博弈理论的基础,并且形成了理论体系。此后经过了许多科学家的共同努力,尤其是纳什提出并证明了纳什均衡的存在,目前,博弈理论已经形成比较完善的理论体系,成为一门横跨各个领域的交叉科学,是非常重要的分析工具。近几十年来,许多研究博弈理论的科学家,如Nash、Selten、 Har Sanyi、Aumann、 Schelling 等都先后被授予了诺贝尔经济学奖,由此可见博弈理论已经受到了越来越多的重视,也得到了广泛的承认。 经典博弈理论跟演化博弈理论 博弈论有以下一些主要的要素:(1)局中人(players):就是指那些参与博弈的个体。(2)策略(strategies):再每一局博弈中,每个局中人都可以有不同的选择,所有的这些选择就成为策略。(3)收益(payoffs):每个局中人做出一定的选择后,在每局博弈结束后,都会有一个结果,这个结果就称为收益。(4)顺序(orders):每个局中人并不是同时做出决定,而且在一局博弈中可能不止做出一个决定,因此就出现了顺序问题,顺序不同,博弈的结果也就不同。 经典博弈论有两个重要特征:一是参与博弈的个体是完全理性的,二是参与博弈个体间的目标或利益是相互冲突的。经典博弈论就是想表明:在所有参与博弈的博弈个体都想获胜或者希望收益最大化的情况下,博弈个体可以通过借助博弈理论分析计算后找到一种最好的方法。但是,在现实世界里,所有个体都完全理性是做不到的,并且,个体做决定时还要受其它很多因素的影响,比如亲情、遗传、以后的发展等等。 一般的演化博弈理论是把随着时间变化的某一种群作为研究对象的,把试图理解种群演化的动态过程,并解释为何这一种群会达到这一状态以及是如何达到的作为研究探索的目的。影响群体变化的因素是多方面的,既包括一些随机的,突变产生的因素,又包括通过演化过程中的选择机制而呈现出来的规律的因素。大部分演化博弈理论的预测力在于具有一定惯性的群体选择过程,但是同时,这个过程也应该具有突变的动力,这样才能不断更新种族特征。 “囚徒困境”模型的研究进展 (1)囚徒困境模型 囚徒困境的原始模型是两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是非常困难的。具体的“囚徒困境”模型说的是,两个犯罪嫌疑人甲和乙作案后被抓后,分别被警察关在不同的屋子里审讯。警察告诫他们:如果他们两个人都认罪,各判3年;如果两个人都保持沉默,各判1年(可能是由于证据不足);如果其中一个认罪另一个沉默,认罪的放出去,不认罪的判刑5年。 甲沉默 甲认罪 乙沉默 二人同服刑1年 乙服刑5年,甲即时获释 乙认罪 甲服刑5年, 乙即时获释 二人同服刑3年 上述表格给出了“囚徒困境”博弈矩阵。这里,每个囚徒有两种策略:沉默或认罪。在这个模型中,如果甲沉默,那么乙认罪比沉默所获的罪刑少;如果甲认罪,那么乙还是认罪获刑比沉默获刑较少。也就是说无论甲做出什么样的选择,对于乙来说他的最优策略是认罪。同样的,对于甲来说他的最优策略也是认罪。也就是说在这个“囚徒困境”博弈中,双方都认罪是纳什均衡。 从“囚徒困境”博弈中我们很容易发现,如果两个人都沉默,各判一年,比两个人都认罪,各判3年好。但是由于他们都从自身的利益处分,所以并没有选择对双方都有利的策略。所以,“囚徒困境”模型反映了个体理性与集体理性的矛盾。 (2)网络结构 在一个系统中,或者在多人参与的演化博弈中,个体间总是相互作用的。那怎样描述个体间的相互关系呢?网络成为描述博弈个体间相互作用的做好方法。 就博弈论而言,局中人就可以抽象表示为网络中的节点;而局中人之间的相互关系便可以抽象为网络的边。我们通常只考虑节点之间有没有相连,忽略边的长度以及节点间的相互位置。我们把网络这种不依赖于节点的具体位置和边的其体形态就能表现出来的性质叫做网络的拓扑性质,相应的结构叫做网络的拓扑结构。 (3)规则格子对于 “囚徒困境”模型的空间博弈的影响 Nowak和 May率先研究了扩展的囚徒困境博弈模型,他们将参与局中人置于二维方格上 , 每个局中人与直接相邻的 4个最近邻进行博弈,并且累计收益,然后开始更新策略。更新规则是:一个局

文档评论(0)

chengzhi5201 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档