《博弈论与公共政策》完全信息动态博弈B解决方案.pptVIP

《博弈论与公共政策》完全信息动态博弈B解决方案.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论与公共政策 刘 霖 北京大学政府管理学院 第二讲 完全信息动态博弈 主要内容 一、博弈的扩展式表述 二、动态博弈的均衡 三、子博弈精炼纳什均衡 四、颤抖手精炼均衡 五、承诺 六、重复博弈 七、扩展及应用 博弈实验1 海盗分金 一、博弈的扩展式表述 1、博弈的扩展式表述 ① 参与者 ② 每个参与者在何时行动 ③ 每次轮到某一参与者行动时,可供他选择的行动 ④ 每次轮到某一参与者行动时,他所了解的信息 ⑤ 对应于参与者可能选择的每一行动组合,各个参与者的收益 通常可以用博弈树来描述博弈的扩展式。 例1 :简单诉讼博弈 甲、乙双方在签订一项合同后,乙方违约。甲方可以选择控告,并索赔8000元,但控告需要花3000元诉讼费;甲方也可以选择忍受,一切维持现状。一旦甲方控告并提出索赔,乙方可以提出和解并赔偿8000元;乙方也可以选择上法庭。如果上法庭,甲方将胜诉,乙方将被判赔偿9000元,且双方各需要支出2000元的诉讼费。 甲方应当控告还是忍受? 博弈过程 博弈树 通过引入机会结,我们也可以纳入存在不确定性的情况,如下图: 2、信息集 参与者的一个信息集是指满足以下两个条件的决策结的集合: ① 在此信息集中的每一个结点都轮到该参与者行动。 ② 当博弈的进行达到该信息集中的一个结,应该行动的参与者并不知道达到了信息集中的哪一个结。 3、策略 参与者的一个策略是关于行动的一个完备计划,它明确了在参与者可能遇到的每一种情况下对可行行动的选择。 思考: 在下面的博弈中,两个参与者各自的策略空间分别是什么? 例 2 4、扩展式表述与标准式表述 任何博弈都既可用标准式表述,又可用扩展式表述。 (1)用扩展式表述囚徒困境博弈(第1讲中的例子) 第1讲之例1:囚徒困境 (2)用标准式表述例2中的博弈 二、动态博弈的均衡 1、利用标准式表述求纳什均衡 2、在博弈树上找纳什均衡 博弈实验2:序贯谈判 甲、乙两人商谈如何分配5元钱。谈判可以有无限期,依次由甲、乙轮流出价。只要一方接受另一方的出价,博弈就结束;否则,博弈就进入下一轮。 每延迟1期,甲、乙双方的延迟成本分别为0.1元、0.2元。 3、可置信的威胁与不可置信的威胁 一种威胁所规定的行动在事前看来是最优的,但事后看并不是参与者的最优选择,这种威胁就是不可置信的,含有这种威胁的策略就不是一个合理的策略。 在例2中,哪是可置信的威胁,哪是不可置信的威胁? 三、子博弈精炼纳什均衡 1、子博弈 扩展式博弈中的子博弈是指博弈的一部份,要求: ① 始于博弈树中一个单结信息集的决策结,但不包括博弈的第一个决策结; ② 包含该决策结之下所有的决策结和终点结; ③ 没有分割任何信息集。 2、子博弈精炼纳什均衡 如果参与者的策略组合不仅在整个博弈上构成纳什均衡,而且在每一子博弈中都构成纳什均衡,则称该策略组合是子博弈精炼纳什均衡。 子博弈精炼纳什均衡排除了不可置信的威胁。 参看例2。 3、逆向归纳法 从最后一个决策结开始,找出该子博弈的纳什均衡;然后再分析倒数第二个决策结,找出相应子博弈的纳什均衡;如此一直到初始决策结,整个博弈及所有子博弈上的最优选择就构成了子博弈精炼纳什均衡。 例 3 例1: 简单诉讼博弈(续) 我们将例1中的收益数字做些改动而变为下面的博弈,会出现什么结果? 例4:诉讼博弈 对于下面的博弈,如果Y=7千元,原告的最优策略是什么? 例4:诉讼博弈(续) 对于下面的博弈,原告的最优策略是什么? 4、均衡、均衡路径与解 一个均衡是各参与者的策略组合,而策略又是完备的(即针对所有可能情况的)行动计划。 精炼纳什均衡下所经过的决策点和最优选择构成的路径,称为均衡路径。 其他的路径是非均衡路径。 一个解则指一条均衡路径,即在给定的策略组合下各参与者的实际行动组合。 例 6 5、逆向归纳法背后的理性假定 在例 5 中,均衡结果依赖于非均衡路径上的选择:参与者 1 之所以起初就选择 U ,是因为他预期如果选择 D 的话,参与者 2 将选择 L ;而 2 之所以选择 L ,是因为她预期如果选择 R 的话,参与者 1 将选择 U’。 可是,只有在 1 偏离了博弈的逆向归纳解之后才能轮到 2 行动,而这时 2 似乎不能认为 1 是理性的了,从而 2 未必就会选 L 。逆向归纳出问题了? 四、颤抖手精炼均衡 应该怎样理解对手出乎意料的行动?这种行动既可能是对手粗心大意的结果,也可能是对手处心积虑的行为,当然也可能源于对手确实非理性。 颤抖手精炼均衡(trembling-hand perfect equilibrium)从对手粗心犯错的角度出发,提出了一种对子博弈精炼均衡再精炼的方法。 颤抖手精炼均衡的基本思想是,在任何一个博弈中,每一个参与者都有一定的可能性犯错误(类似于一个人抓东西

文档评论(0)

w5544434 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档