共同进化博弈指导.pptVIP

下载本文档

1
0
约6.24千字
约 27页
2017-03-18 发布于北京
举报
版权申诉

共同进化博弈指导.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

共同进化博弈周歆辰程亮喜时丹 2010年3月20日内容提要问题的引出博弈的结构演化规则和过程程序实现结果分析与讨论结论和未来的工作问题的引出空间博弈经典博弈论主要研究的是博弈的进程随着时间的发展如何演化，而空间的效应仍然是个空白。这个空白在1992年被Nowak和May填补。他们设想了一个元胞自动机，每个方格代表一个博弈者，他和相邻的博弈者进行博弈（比如摩尔邻居或者冯·诺依曼邻居），然后计算博弈之后，所有方格中的博弈者的支付，每个博弈者以一定的规则继承邻居中支付最高的那一个，然后进行下一轮博弈。这样的演化规则将使我们看到在一个空间里，博弈者相互影响，相互学习的状况，从而可以进行一系列有关讨论。问题的引出从简单的方格（元胞自动机）到复杂网络博弈，是近期的研究热点。这种转变更加接近现实，并且可能会呈现出与普通网格不一样的结果。没有距离概念的网络，已经被证实是支持合作的产生的。随后，在对集群网络，或者无网络结构也有大量的研究。博弈类型、记忆、环境等多方面的因素也被考虑到空间博弈当中没，例如小世界等多种形式。另外，不同拓扑结构的相互影响以及不同支付矩阵的共存，成为了超出博弈理论以外的影响因素。问题的引出演化规则：亲属性的演化法则自愿参加社会复杂性连接之间的非对称影响及非对称的进化不同的学习规则理论上的研究：演化动力学有限人口噪音和更多的不确定性问题的引出目前的绝大多数研究都只考虑在每一轮中的一个静态博弈，即博弈者并无先后顺序，每个博弈者都不知道在本轮中对方的决定。我们的研究是基于这种有先后的动态博弈的基础上，通过一定的空间结构来观察博弈者的策略演化情况。这种演化是基于记忆效应的。我们用有限状态机表现这种记忆效应。博弈的结构考虑多轮次的多人博弈，在每一轮中，一些博弈者将进行2人动态博弈。为了观察这些动态博弈的进展，对于一类特殊的矩阵，假想了一套“承诺和威胁”体系。在一组二人博弈中，B博弈者先给A发送一个可达到帕累托效率解的信息，然后A做出选择（即是否相信），随后B做出是否遵守诺言的选择。这样，博弈的结果唯一确定，并且B和A的一种类似声望的因素被其他博弈者们观察到，这个声望也会对随后与A或B进行的博弈产生影响。博弈的结构一个可能的支付矩阵在左图中，承诺和威胁是可以成立的。B先给A发送一个我会合作的信号，即不论怎样B都会选择向右（图中虚线）。如果A相信了，他会选择右，否则他会选择左。如果B守信，他会选择右，否则选择左。这个威胁如果只运用在单次博弈中就是不可置信的，显然图中深实线表示了该博弈的子博弈完美纳什均衡，也是演化稳定策略。但是在多人博弈中，这个威胁就可能起到效果，因为这可能影响到A或B的声誉。博弈的结构承诺或者威胁能在多人博弈中起到作用的支付矩阵满足的条件：演化规则和过程为了研究这个博弈，我们的想法是考虑一个空间博弈，这个博弈建立在方格上，右图是这个一部分博弈空间的示意：演化规则和过程在每一轮博弈，博弈者以1/4的概率挑选一个邻居（诺依曼邻居）博弈一次。当所有的博弈者都进行完一次博弈后，他们将在这一轮获得一个支付。连同之前的支付，将有一个支付总值。在学习的过程中，他们总可以以如下方式继承四角的同类博弈者的策略：这里以A为例，记周围同类邻居为Ai（i=1，2，3，4），在这一轮过后Ai的支付总值为Fi，Pi为继承该博弈者周围同类邻居Ai的概率，则：演化规则和过程什么是策略？策略是一个有限状态机，状态栏表示博弈的对手在过去M个记忆深度的下的行为，即守信程度或者相信程度，策略栏表示自己在这一次所做的行为，如果是A型，就是相信或者不相信，如果是B型，就是守信或者不守信。演化规则和过程 A的一个可能的有限状态机如右图。守信程度栏中表示B的守信历史，0代表守信，1代表不守信；在策略栏中是A的策略，0代表相信，1代表不相信。记忆深度m=3。演化规则和过程 B的可能的一个有限状态机表如右图，其中状态栏的第一列表示A在本轮是否相信，如果相信则为0，不相信则为1；第二列表示在记忆深度m=3时A的相信状况，编码规则同上；策略栏中是B的相应的策略，0表示守信，1表示不守信。演化规则和过程注意到这样一个博弈中，相信与守信恰好能够与左或者右进行一一映射，于是这种博弈结构能够推广到更加一般的情形。这个映射如下表所示（上图为原矩阵，下图为象矩阵）