《博弈论与公共政策》完全信息动态博弈B解决方案.pptVIP

下载本文档

43
0
约5.29千字
约 76页
2016-11-12 发布于湖北
举报
版权申诉

《博弈论与公共政策》完全信息动态博弈B解决方案.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论与公共政策刘霖北京大学政府管理学院第二讲完全信息动态博弈主要内容一、博弈的扩展式表述二、动态博弈的均衡三、子博弈精炼纳什均衡四、颤抖手精炼均衡五、承诺六、重复博弈七、扩展及应用博弈实验1 海盗分金一、博弈的扩展式表述 1、博弈的扩展式表述 ① 参与者 ② 每个参与者在何时行动 ③ 每次轮到某一参与者行动时，可供他选择的行动 ④ 每次轮到某一参与者行动时，他所了解的信息 ⑤ 对应于参与者可能选择的每一行动组合，各个参与者的收益通常可以用博弈树来描述博弈的扩展式。例1 ：简单诉讼博弈甲、乙双方在签订一项合同后，乙方违约。甲方可以选择控告，并索赔8000元，但控告需要花3000元诉讼费；甲方也可以选择忍受，一切维持现状。一旦甲方控告并提出索赔，乙方可以提出和解并赔偿8000元；乙方也可以选择上法庭。如果上法庭，甲方将胜诉，乙方将被判赔偿9000元，且双方各需要支出2000元的诉讼费。甲方应当控告还是忍受？博弈过程博弈树通过引入机会结，我们也可以纳入存在不确定性的情况，如下图： 2、信息集参与者的一个信息集是指满足以下两个条件的决策结的集合： ① 在此信息集中的每一个结点都轮到该参与者行动。 ② 当博弈的进行达到该信息集中的一个结，应该行动的参与者并不知道达到了信息集中的哪一个结。 3、策略参与者的一个策略是关于行动的一个完备计划，它明确了在参与者可能遇到的每一种情况下对可行行动的选择。思考：在下面的博弈中，两个参与者各自的策略空间分别是什么？例 2 4、扩展式表述与标准式表述任何博弈都既可用标准式表述，又可用扩展式表述。（1）用扩展式表述囚徒困境博弈（第1讲中的例子）第1讲之例1：囚徒困境（2）用标准式表述例2中的博弈二、动态博弈的均衡 1、利用标准式表述求纳什均衡 2、在博弈树上找纳什均衡博弈实验2：序贯谈判甲、乙两人商谈如何分配5元钱。谈判可以有无限期，依次由甲、乙轮流出价。只要一方接受另一方的出价，博弈就结束；否则，博弈就进入下一轮。每延迟1期，甲、乙双方的延迟成本分别为0.1元、0.2元。 3、可置信的威胁与不可置信的威胁一种威胁所规定的行动在事前看来是最优的，但事后看并不是参与者的最优选择，这种威胁就是不可置信的，含有这种威胁的策略就不是一个合理的策略。在例2中，哪是可置信的威胁，哪是不可置信的威胁？三、子博弈精炼纳什均衡 1、子博弈扩展式博弈中的子博弈是指博弈的一部份，要求： ① 始于博弈树中一个单结信息集的决策结，但不包括博弈的第一个决策结； ② 包含该决策结之下所有的决策结和终点结； ③ 没有分割任何信息集。 2、子博弈精炼纳什均衡如果参与者的策略组合不仅在整个博弈上构成纳什均衡，而且在每一子博弈中都构成纳什均衡，则称该策略组合是子博弈精炼纳什均衡。子博弈精炼纳什均衡排除了不可置信的威胁。参看例2。 3、逆向归纳法从最后一个决策结开始，找出该子博弈的纳什均衡；然后再分析倒数第二个决策结，找出相应子博弈的纳什均衡；如此一直到初始决策结，整个博弈及所有子博弈上的最优选择就构成了子博弈精炼纳什均衡。例 3 例1：简单诉讼博弈（续）我们将例1中的收益数字做些改动而变为下面的博弈，会出现什么结果？例4：诉讼博弈对于下面的博弈，如果Y=7千元，原告的最优策略是什么？例4：诉讼博弈（续）对于下面的博弈，原告的最优策略是什么？ 4、均衡、均衡路径与解一个均衡是各参与者的策略组合，而策略又是完备的（即针对所有可能情况的）行动计划。精炼纳什均衡下所经过的决策点和最优选择构成的路径，称为均衡路径。其他的路径是非均衡路径。一个解则指一条均衡路径，即在给定的策略组合下各参与者的实际行动组合。例 6 5、逆向归纳法背后的理性假定在例 5 中，均衡结果依赖于非均衡路径上的选择：参与者 1 之所以起初就选择 U ，是因为他预期如果选择 D 的话，参与者 2 将选择 L ；而 2 之所以选择 L ，是因为她预期如果选择 R 的话，参与者 1 将选择 U’。可是，只有在 1 偏离了博弈的逆向归纳解之后才能轮到 2 行动，而这时 2 似乎不能认为 1 是理性的了，从而 2 未必就会选 L 。逆向归纳出问题了？四、颤抖手精炼均衡应该怎样理解对手出乎意料的行动？这种行动既可能是对手粗心大意的结果，也可能是对手处心积虑的行为，当然也可能源于对手确实非理性。颤抖手精炼均衡（trembling-hand perfect equilibrium）从对手粗心犯错的角度出发，提出了一种对子博弈精炼均衡再精炼的方法。颤抖手精炼均衡的基本思想是，在任何一个博弈中，每一个参与者都有一定的可能性犯错误（类似于一个人抓东西