博弈论课 第四章.ppt

第四讲 重复博弈 何为“重复博弈”? 重复博弈是指基本博弈重复进行构成的博弈过程。 重复博弈中每个阶段中的博弈方、可选策略、规则和得益都是相同的----是特殊的动态博弈; 形式上是基本博弈的重复进行,但博弈方的行为和博弈结果不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发送变化,从而使他们在重复博弈过程不同阶段的行为选择受到影响。 可信度:子博弈完美性仍是判断均衡是否稳定可靠的重要判断依据 §4.1 引 论 4.1.1 为何研究“重复博弈”(Game): 4.1.2 基本概念: 分类:有限次重复博弈,无限次重复博弈 有限次重复博弈:给定一个基本博弈G(可以静态,也可以动态),重复进行了T次G,并且在每次重复G之前,各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。 无限次重复博弈:理论上,重复博弈可以无限制进行下去,不一定经过一定次数重复以后就必须结束。如果一个基本博弈G一直重复下去,这样的重复博弈就是“无限次重复博弈”,记为G(∞)。无限次重复博弈的基本博弈也称为“原博弈”。 无限次重复博弈是有无限个阶段的动态博弈。 重复博弈的次数虽然有限,但重复的次数或博弈结束的时间不确定,这种重复博弈中博弈方的行为选择与确定结束时间的有限次重复博弈很不同,与无限次重复博弈很相似,甚至可以通过某种方式与无限次重复博弈统一起来。这种重复博弈可以称为“随机结束的重复博弈”。 策略、子博弈和均衡路径 策略: 博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段的结果)如何行动的计划。 子博弈: 重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶段的重复博弈部分。 子博弈:重复博弈?原博弈?(最后一个阶段) 路径: 子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡分析及相关结论,可以推广到重复博弈中。 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。 随机停止和贴现率 典型的随机结束重复博弈可以理解为在进行一个重复博弈时,每次都通过抽签来决定是否停止重复,如果抽到停止重复的概率为,则抽到重复下去的概率为。 设某博弈方在此博弈中的阶段得益为,利率为,因为在每一次博弈以后能继续下一次重复的可能性是,因此第二阶段的期望得益为,进一步,第三阶段的期望得益为,… 故该博弈方在重复博弈中期望得益的现值为: 其中最后一个等式是通过令得到的。 把这个与前面纯粹考虑时间价值的贴现率统一起来,我们就把已知概率的随机停止重复博弈与无限次重复博弈统一起来了。随机停止重复博弈问题可以当作无限次重复博弈来进行分析。 4.2 有限次重复博弈 有限次重复博弈:给定一个基本博弈G(可以静态,也可以动态),重复进行了T次G,并且在每次重复G之前,各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。 策略、子博弈和均衡路径 策略: 博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段的结果)如何行动的计划。 子博弈: 重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶段的重复博弈部分。 子博弈:重复博弈?原博弈?(最后一个阶段) 路径: 子博弈完美纳什均衡,以逆推归纳法(逆向归纳法)为核心的子博弈完美纳什均衡分析及相关结论,可以推广到重复博弈中。 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。 4.2.1 两人零和博弈的有限次重复博弈 重复零和博弈不会创造出新的利益。 合作的可能性根本不存在。即使双方都知道还要重复进行许多次基本博弈,也不会改变它们在当前阶段博弈中的行动方式,不可能变得(哪怕是暂时的)合作和顾及对方的利益。 所有以零和博弈为原博弈的有限次重复博弈,博弈方的正确策略都是重复一次性博弈中的纳什均衡策略。 推广:非零和或多个博弈方,博弈方的利益严格对立,没有纯策略纳什均衡的其他严格竞争博弈中。在以这些博弈作为原博弈构成的有限次重复博弈中,惟一的子博弈完美纳什均衡就是所有博弈方都始终采用原博弈的混合策略纳什均衡策略。 有限次重复猜硬币博弈 各博弈

文档评论(0)

1亿VIP精品文档

相关文档