- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
共同进化博弈 周歆辰 程亮喜 时丹 2010年3月20日 内容提要 问题的引出 博弈的结构 演化规则和过程 程序实现 结果分析与讨论 结论和未来的工作 问题的引出 空间博弈 经典博弈论主要研究的是博弈的进程随着时间的发展如何演化,而空间的效应仍然是个空白。这个空白在1992年被Nowak和May填补。他们设想了一个元胞自动机,每个方格代表一个博弈者,他和相邻的博弈者进行博弈(比如摩尔邻居或者冯·诺依曼邻居),然后计算博弈之后,所有方格中的博弈者的支付,每个博弈者以一定的规则继承邻居中支付最高的那一个,然后进行下一轮博弈。这样的演化规则将使我们看到在一个空间里,博弈者相互影响,相互学习的状况,从而可以进行一系列有关讨论。 问题的引出 从简单的方格(元胞自动机)到复杂网络博弈,是近期的研究热点。这种转变更加接近现实,并且可能会呈现出与普通网格不一样的结果。没有距离概念的网络,已经被证实是支持合作的产生的。随后,在对集群网络,或者无网络结构也有大量的研究。博弈类型、记忆、环境等多方面的因素也被考虑到空间博弈当中没,例如小世界等多种形式。另外,不同拓扑结构的相互影响以及不同支付矩阵的共存,成为了超出博弈理论以外的影响因素。 问题的引出 演化规则: 亲属性的演化法则 自愿参加 社会复杂性 连接之间的非对称影响及非对称的进化 不同的学习规则 理论上的研究: 演化动力学 有限人口 噪音和更多的不确定性 问题的引出 目前的绝大多数研究都只考虑在每一轮中的一个静态博弈,即博弈者并无先后顺序,每个博弈者都不知道在本轮中对方的决定。 我们的研究是基于这种有先后的动态博弈的基础上,通过一定的空间结构来观察博弈者的策略演化情况。这种演化是基于记忆效应的。我们用有限状态机表现这种记忆效应。 博弈的结构 考虑多轮次的多人博弈,在每一轮中,一些博弈者将进行2人动态博弈。为了观察这些动态博弈的进展,对于一类特殊的矩阵,假想了一套“承诺和威胁”体系。在一组二人博弈中,B博弈者先给A发送一个可达到帕累托效率解的信息,然后A做出选择(即是否相信),随后B做出是否遵守诺言的选择。这样,博弈的结果唯一确定,并且B和A的一种类似声望的因素被其他博弈者们观察到,这个声望也会对随后与A或B进行的博弈产生影响。 博弈的结构 一个可能的支付矩阵 在左图中,承诺和威胁是可以成立的。B先给A发送一个我会合作的信号,即不论怎样B都会选择向右(图中虚线)。如果A相信了,他会选择右,否则他会选择左。如果B守信,他会选择右,否则选择左。这个威胁如果只运用在单次博弈中就是不可置信的,显然图中深实线表示了该博弈的子博弈完美纳什均衡,也是演化稳定策略。但是在多人博弈中,这个威胁就可能起到效果,因为这可能影响到A或B的声誉。 博弈的结构 承诺或者威胁能在多人博弈中起到作用的支付矩阵满足的条件: 演化规则和过程 为了研究这个博弈,我们的想法是考虑一个空间博弈,这个博弈建立在方格上,右图是这个一部分博弈空间的示意: 演化规则和过程 在每一轮博弈,博弈者以1/4的概率挑选一个邻居(诺依曼邻居)博弈一次。当所有的博弈者都进行完一次博弈后,他们将在这一轮获得一个支付。连同之前的支付,将有一个支付总值。在学习的过程中,他们总可以以如下方式继承四角的同类博弈者的策略: 这里以A为例,记周围同类邻居为Ai(i=1,2,3,4),在这一轮过后Ai的支付总值为Fi,Pi为继承该博弈者周围同类邻居Ai的概率,则: 演化规则和过程 什么是策略? 策略是一个有限状态机,状态栏表示博弈的对手在过去M个记忆深度的下的行为,即守信程度或者相信程度,策略栏表示自己在这一次所做的行为,如果是A型,就是相信或者不相信,如果是B型,就是守信或者不守信。 演化规则和过程 A的一个可能的有限状态机如右图。守信程度栏中表示B的守信历史,0代表守信,1代表不守信;在策略栏中是A的策略,0代表相信,1代表不相信。记忆深度m=3。 演化规则和过程 B的可能的一个有限状态机表如右图,其中状态栏的第一列表示A在本轮是否相信,如果相信则为0,不相信则为1;第二列表示在记忆深度m=3时A的相信状况,编码规则同上;策略栏中是B的相应的策略,0表示守信,1表示不守信。 演化规则和过程 注意到这样一个博弈中,相信与守信恰好能够与左或者右进行一一映射,于是这种博弈结构能够推广到更加一般的情形。这个映射如下表所示(上图为原矩阵,下图为象矩阵)
您可能关注的文档
最近下载
- 统编版必修中外历史纲要上《第3课 秦统一多民族封建国家的建立》公开课一等奖创新教学设计.docx VIP
- 2025年北京市东城区九年级初三一模数学试卷(含答案).pdf VIP
- 睾丸扭转--精品课件.ppt VIP
- 科技三项费用管理办法.doc VIP
- CB-T 4537-2023船舶行业企业隐患治理管理规定.pdf VIP
- YY_T 1453-2016组织工程医疗器械产品 I型胶原蛋白表征方法.pdf
- 大学生毕业论文写作教程PPT全套教学课件.pptx
- 拱形屋面板高支模专项方案1.doc VIP
- 2025年辅警招聘考试题题库(含参考答案).docx VIP
- 船舶行业企业隐患治理管理规定.pdf VIP
文档评论(0)