第九章-多阶段博弈.pptx

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 多阶段博弈本章重点: 多阶段博弈的定义及其特征 多阶段博弈总支付的计算 理解多阶段博弈的纯策略,理解及其运用策略性关联 理解及运用在t-1期前选择非纳什均衡策略的条件 多阶段子博弈纳什均衡及其与策略性关联的关系 几个定理及一阶段偏离原则的理解本章主要内容一、预备知识二、支付三、策略和条件性博弈行为四、子博弈完美纳什均衡五、一阶段偏离原则 一、预备知识多阶段博弈的定义:为一个标准阶段博弈的有限序列,在其中每一个阶段博弈都是独立的、完全但不完美信息的博弈(同时行动博弈)。这些阶段博弈由相同的参与人依次进行,而由这一博弈序列得到的总支付用博弈结果序列来评价。每个阶段结束之后,所有参与人都可以观察到该阶段的结果,而且这一信息结构是共同知识二、支付因为多阶段博弈是一个跨期博弈,当涉及跨期问题时我们就需要对未来的收益进行折现。而折现因子 的大小则由参与人的耐心决定,折现因子 越高意味着参与人越有耐心,也就更为关心未来的支付。没有耐心的极端情况发生在 的时候,此时说明参与人只关心当前这一阶段博弈的支付。我们来看这样一个多阶段博弈,其中共有T个阶段博弈,每个时期标号为1,2,……,T。令 表示参与人i预期从在时期t的阶段博弈结果中得到的参与人i的支付。我们用 表示参与人i在这个多阶段博弈中进行该博弈序列所得到的总支付,将它定义为:它是参与人预期在这博弈序列中所得支付的折现总和。三、策略和条件性博弈行为1.策略在多阶段博弈中,参与人可以通过在不同阶段的博弈间创造策略性关联的策略(一般是将后面阶段博弈中的行为建立在早前阶段博弈中采取的行动这一条件之上的),以此从中获利。参与人可以使用这种形式的策略:“如果在博弈1,2,……,t-1中如此等等皆发生了,那我们博弈t中就选择行动 。”在多阶段博弈中判定每个参与人的信息集是很重要的,而在任一阶段t上信息集的数目必然与前面的阶段博弈1,2,……,t-1中得来的可能结果的数目相等。例如,第一阶段博弈有四个结果,则在第二个阶段博弈上,每个参与人应当有四个信息集。需要注意的是,在每一个阶段博弈中,参与人并不知道其对手在该阶段的选择是什么,这意味着我们在该阶段的某些信息集上有不止一个结点。2.条件性纯策略在一个有T个阶段博弈构成的多阶段博弈中,参与人i的一个纯策略可以是下面这种形式的条件性纯策略列表: 其中 是出现在时期t之前的特定结果,但是不包括时期t,而 是参与人从第t个阶段博弈中得出的行动。我们来看一个n企业博弈,这些企业在一系列市场上进行价格选择对于这个例子来说,参与人i的一个纯策略就是一个连续函数的列表,每一个都是从连续多个历史的集合到一个单一价格之上。总而言之,多阶段博弈策略的定义可以使用扩展式来表达该博弈的结构。进而言之,和在扩展式博弈中一样,策略被定为每一参与人在每一信息集上(混合或纯)策略的完备列表。在多阶段博弈中,每个参与人的信息集都和之前阶段博弈中的博弈历史相联结。四、子博弈完美均衡1、命题9.1 考虑具有T个阶段的一个多阶段博弈,令 为第t个阶段博弈的一个纳什均衡策略剖面。在这个多阶段博弈中,存在一个子博弈完美均衡,其均衡路径与产生自 的路径是一致的。在多阶段博弈中引入子博弈完美纳什均衡就相当于将阶段之间的任何策略性关联予以排除,这样我们就可以把每一个阶段当做一个独立博弈一样进行求解。2、命题9.2 如果 是由阶段博弈 构成的多阶段博弈的纳什均衡,那么将 限制在时期T上的阶段博弈,必是该阶段博弈的一个纳什均衡。这个命题告诉我们,对于时长为T的任一有限阶段博弈而言,在最后一个阶段博弈 上参与人必然会采取该阶段博弈上的一个纳什均衡。3、命题9.3 如果一个有限的多阶段博弈,其每个阶段博弈都有唯一的一个纳什均衡,那么这一多阶段博弈就有唯一的子博弈完美纳什均衡。4、对于两阶段博弈而言,要使第一阶段上选择非纳什均衡的行为成为可能,需要以下两个条件:在第二个阶段必有至少两个不同的均衡:“大棒”和“胡萝卜”。对于“大棒”和“胡萝卜”之间在支付上的差异来说,折现因子一定会大到对博弈的第一个阶段有着足够充分的影响。为了检查一个策略剖面是否在一个多阶段(或任一有限扩展式)博弈中是子博弈完美纳什均衡,我们所需证明的全部就是在给定 的条件下,每一参与人i不具有一个他打算偏离的单一信息集。举例:囚徒-复仇博弈假设在第一个时期t=1,来自两个相邻社区的参与人进行我们熟悉的囚徒困境博弈,各自采取两个纯行动:沉默(mum)和告密(fink)(大写的表示参与人1的行动,小写的表示参与人2的行动),其支付矩阵为:在这个博弈结束之后,同样是这两个参与人在时期t=2继续玩复仇博弈。每个参与人都可以选择是否加入他的社区帮(gang,即G或g)或者继续保持“孤家寡人(loner,即L

文档评论(0)

好文精选 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档