- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
进化博弈论读书心得
进化博弈论读书心得
PAGE
进化博弈论读书心得
进化博弈论读书报告
汪波
1973年,梅拉德·史密斯和普瑞斯将博弈论的思想引入到生物演化的分析中,二人提出了进化稳定策略(ESS),随着1978年, Taylor和Jonker发现了进化稳定策略和复制动力学之间的关系,标志着进化博弈理论的诞生,因为与复制动力学之间的关系,进化稳定策略也因此成为进化博弈理论最经典的概念。1982年,梅拉德·史密斯出版了《演化与博弈论》,该书揭示动物群体的行为变化的动力学机制,也因此书他被称为进化博弈论之父,1995年,Weibull著作了《Evolutionary Game Theory》,2009年初,Sandholm 出版了《Population Game and Evolutionary Dynamics》专著,这篇读书报告是在看了这三本著作的很少的一部分内容之下,理解其中一些浅显的内容后完成的。
一、进化稳定策略最初的模型
进化博弈理论是将博弈论引入到生物学背景下产生的,当生物的特定表现型的适应度依赖于群体中的频率分布时,进化博弈论就是从这个角度来思考生物演化的问题的一种方法,古典博弈中,参与者根据自利的原则表现出理性行为,但在生物进化的背景下是不合适的,由此,理性原则被群体的动态性和稳定性取代,而自利原则则被达尔文的适应度所取代。在一些重要的假设下,将会得到博弈的一个新形式解:进化稳定策略。它是这样一个策略,如果整个群体的每个成员都采取这个策略,那么在自然选择的作用下,不存在一个具有突变特征的策略能够侵犯这个种群。
最初的简化的模型由梅拉德·史密斯和普瑞斯给出,他和普瑞斯也给出了进化稳定策略的数学式的描述定义,这一模型的本质特征是假设该群体有无限大的规模,繁衍以无性生殖的方式进行,竞争只在两个不存在任何差异的对手间展开即是成对的竞争。生物学中价值是指两个动物为了争夺资源而增加的或者减少的达尔文适应度。故我们用适应度作为最后个体的收益的衡量,假想在这个无限的种群中,有两个策略、,每一个成员都采取这两个策略之一,且策略的选择是随机的,在有竞争前个体的初始适应度为,再假设整个群体中选择的概率为,、分别表示选择相应策略带来的适应度,而表示个体选择策略而对手选择时的收益,其他等表示类同的意义。
若每一个个体都参与到竞争当中,则有
(1-1)
(1-2)
稳定的策略具有下列性质:整个种群中几乎所有的个体都采取了这个策略,且这些个体的
适应度必将高于竞争对手或者可能出现的突变异种的适应度,否则竞争对手或者产生的突变
异种会侵害整个种群,以致种群的削弱或者毁灭等,这时此策略便不可能是稳定的策略。若
是进化稳定策略,则,且,所以当,有
(1-3)
当时有 (1-4)
满足上述条件(1-3)、(1-4)的策略就称为进化稳定策略,而上述的两个条件1-3、1-4也被认为是判别的标准条件。
上述的策略是在纯策略情形下考虑的,当策略是从一个可能策略集合中随机的选择而构成的,此时的策略称为混合策略。此时若是一个混合进化稳定策略,假设等是该群体的纯策略,赋予这些纯策略非零的概率值,那么必须满足如下条件:
(1-5)
保证所有纯策略的回报是相等的,群体中的个体才不会选择偏离的策略。此时起满足的条件和上述是相同的形式。
二、对称博弈
1.对称博弈的定义
两人对称博弈对于许多进化博弈论内容而言是基础的,而且,许多进化博弈论中的深刻见解都可以从二人对称博弈这种特殊情形中得到,这也是单独列出对称博弈内容的主要原因。
一个二人对称博弈,可假设有两个玩家的位置,每个位置上有相同的纯策略,而任意的策略的支付则依赖于玩家所选的位置,因此有如下的定义:
博弈称为二人对称博弈,如果,且对于任意的有成立。
该对称博弈要求两个位置上的支付矩阵是互为转置的,即若为第一人的支付矩阵,为第二个人的支付矩阵,则,即
则
也即有若,则。
例如:囚徒困境情形就是一个非常好的对称博弈的例子。
上述是在纯策略下的情形,现在描述混合策略情形:,用表示策略集上的一个概率分布,即为该博弈的一个混合策略,用表示其混合策略集,则混合策略组合空间为,此时任意的纯策略在对手选择混合策略时的支付为。
2.对称博弈的特点
对称博弈是一种很特殊情形,它有自己的特征,一是对称博弈的最
文档评论(0)