博弈论福州大学课件经管学院.ppt

* 第三章 完全信息动态博弈 一、博弈的扩展式表示 1、博弈扩展式描述包括的六要素 1)参与人集合; 2)参与人的行动次序:谁在什么时候行动; 3)参与人的行动空间:在每次行动时,参与人有哪些选择; 4)参与人的信息集:每次行动时,参与人知道些什么; 5)参与人的支付函数:行动结束后,每个参与人得到些什么; 6)外生事件(即自然的选择)的概率分布。 2、博弈树(博弈扩展式) 1)结:包括决策结(采取行动的时间)与终点结。 2)枝:决策结到它直接后接点的连线,它代表参与人的行动、路径。 3)信息集:决策结的子集,要满足: ①信息集中每个结应属于同一参与人; ②参与人知道博弈进入某信息集,但不知自己处在信息集中的哪一个结(多结点信息集时); ③参与人在同一个信息集上的每一个结上的行动空间是相同的;④信息集中每个结应是同一时点的决策结 。 例 房地产开发博弈: ①开发商A首先行动,选择开发或不开发; ②A决策后,自然选择市场需求大小; ③开发商B在观测到A的决策和市场需求后,决定开发或不开发。 3、静态博弈的扩展式表示 例1 囚徒困境 例2 四人同时决策,每人有两种选择(L,U),请画出博弈树。 练习 用博弈树表示下述博弈。 第一步:局中人1掷一枚硬币,结果可能是正面H或反面T; 第二步:局中人2不知第一步硬币的结果,再掷一次硬币; 第三步:局中人1知第一、二步硬币的结果,又掷一次硬币; 第四步:局中人2不知第三步的结果,但知一、二两步的结果,最后掷一次硬币,博弈结束(按每步结果,局中人2给1一笔报酬)。 二、扩展型博弈转化为策略型博弈 例1 房地产开发博弈 A 开发 不开发 B B 开发 不开发 开发 不开发 (-3,-3) (1,0) (0,1) (0,0) 例2 考虑以下动态博弈。 第一步:局中人1从{1,2}中选择一数x。 第二步:局中人2知道x的值,从{1,2}中选择y。 第三步:局中人1不知y,也忘了x,从{1,2}中选择z,博弈结束。对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z) U1(1,1,1)=-2; U1(1,1,2)=-1; U1(1,2,1)=3; U1(1,2,2)=-4; U1(2,1,1)=5; U1(2,1,2)=-2; U1(2,2,1)=2; U1(2,2,2)=6。 例3 带有机会选择的动态博弈。 第一步:用一个随机装置,从{1,2}中等可能地选择数x。 第二步:局中人1知道x值,从{1,2}中选择y。 第三步:局中人2不知x,但知y,从{1,2}中选择z,博弈结束。 对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z) U1(1,1,1)=-2; U1(1,1,2)=-1; U1(1,2,1)=3; U1(1,2,2)=-4; U1(2,1,1)=5; U1(2,1,2)=-2; U1(2,2,1)=2; U1(2,2,2)=6。 练习 考虑以下动态博弈。 第一步:局中人1从{1,2}中选择一数x。 第二步:局中人2知道x的值,从{1,2}中选择y。 第三步:局中人1知道y的值,从{1,2}中选择z,博弈结束。对选定的x,y,z,局中人2给局中人1的费用为U1(x,y,z) U1(1,1,1)=-2; U1(1,1,2)=-1; U1(1,2,1)=3; U1(1,2,2)=-4; U1(2,1,1)=5; U1(2,1,2)=-2; U1(2,2,1)=2; U1(2,2,2)=6。 三、子博弈精炼纳什均衡 子博弈定义:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足如下条件:1) x是一个单结信息集,即h(x)={x};2)对于所有的 ,若 ,则 。 子博弈精炼纳什均衡定义:称扩展式博弈G的策略组合 为子博弈精炼NE,若:1)它是原博弈 的NE;2)它在每一个子博弈上给出NE。 定理:有限、完美信息的扩展型博弈必存在纯策略意义下的子博弈精炼纳什均衡。 子博弈精炼纳什均衡的解法:逆向递推法。 例 1 2 1 L R L1 R1 L2 R2 (2,0) (1,1) (3,0) (0,2) 例 海盗分金:五个海盗要分配抢来的100枚金币,方式是,第一个人提出一种分配方案,如果同意这种方案的人达到半数,那么提议通过,否则提议的人就被扔进大海,由剩下的人再进行同样的过程。假设五个人提议的次序已定,金币不能分割,而且海盗的本性让他们觉得,如果对自己的收益没有影响,则很乐意看到别人被扔进大海,这时理性结局应是如何? 例 斯坦克尔伯格(Stackelberg)寡头竞争模型 例

文档评论(0)

1亿VIP精品文档

相关文档