北大精品课件：《博弈论与公共政策》之完全信息静态博弈.ppt

下载文档 降价啦

2
0
约4.16千字
约 63页
2017-12-19 发布于浙江
举报
版权申诉
保障服务

北大精品课件：《博弈论与公共政策》之完全信息静态博弈.ppt

1、本文档共63页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

北大精品课件：《博弈论与公共政策》之完全信息静态博弈

博弈论与公共政策北大精品课件完全信息静态博弈主要内容一、博弈的标准式表述二、占优策略均衡三、重复剔除的占优均衡四、纳什均衡五、多重纳什均衡的比较六、混合策略七、应用举例何谓静态博弈？开始时由参与者同时选择行动，然后根据所有参与者的选择，每个参与者得到各自的结果。何谓完全信息静态博弈？每一参与者的收益函数在所有参与者之间是共同知识。一、博弈的标准式表述博弈的标准式表述包括三个方面的内容：（1）博弈的参与者（2）每个参与者可供选择的策略集（3）针对所有参与者可能选择的策略组合，每个参与者获得的收益对于一个 n 人博弈，设各参与者的策略空间依次为 S1,S2, …,Sn ，收益函数分别为u1,u2, …,un ，其中 ui (s1,s2, …,sn) 为参与者选择策略组合 (s1,s2, …,sn) 时参与者 i 的收益，则可用标准式将该博弈表示如下： G = {S1,S2, …,Sn ； u1,u2, …,un } 在双人有限策略的情况下，可以用双变量矩阵更直观地表述博弈。例1：囚徒困境但是，如果参与者超过2人，则用双变量矩阵形式来表示博弈就不那么方便了，甚至根本无法采用这种形式。例2：三人有限策略博弈二、占优策略均衡 1、占优策略在博弈中，如果不管其他参与者选择什么策略，某个参与者的特定策略都优于或至少不劣于其他所有策略，那么，我们就说这个特定策略是该参与者的占优策略。在前面的囚徒困境博弈中，“招认”就是每个囚徒的占优策略。 2、占优策略均衡如果每个参与者都存在占优策略，那么由这些占优策略构成的组合就称为占优策略均衡。在前面的囚徒困境中，（招认，招认）就构成一个占优策略均衡。注意：占优策略均衡只要求每个参与者是理性的，而并不要求每个参与者知道其他参与者是理性的，也就是说，不要求“理性”是共同知识。例3：公共产品的供应问题 A、B两人同住一室，现在，他们考虑是否购买一台电视机。电视机的价格为4000元，每个人从看电视中获得的效用各为3000元。假定他们根据下列程序决定是否购买电视机：每人把是否购买电视机的想法写在一张纸条上，如果两人都认为应该购买，则平均分担购买电视机的费用。如果两人都认为不应该购买，则不购买电视机。如果只有一人提出购买而另一人不想购买，则由提出购买的人独自购买电视机。每个人会如何决策？三、重复剔除的占优均衡 1、重复剔除的占优均衡首先从某一参与者的策略集里剔除掉一个劣策略，再重新考察各个参与者剩下的策略中哪些是劣策略并剔除其中之一，不断继续这一过程直到每个参与者都仅剩一个策略为止，最后得到的策略组合就称为重复剔除的占优均衡。例4：俾斯麦海之战在单人决策中，当所有情况下的收益都增加（至少不减少）时，当事者的境况不会变得更坏，但在博弈中则未必。比较下面的两个博弈：例 5 2、理性共识重复剔除的占优均衡不仅要求每个参与者是理性的，而且要求“理性”是参与者的共同知识，即参与者具有“理性共识”（Common Knowledge of Rationality，简记为CKR）。理性共识可划分为不同的层次：零阶理性共识：每个人都是理性的，但不知道其他人是否理性。一阶理性共识：每个人是理性的，并且知道其他人也都是理性的，但并不知道其他人是否知道自己是理性的。二阶理性共识：每个人是理性的，也知道其他人都是理性的，而且知道其他人知道自己是理性的，但不知道其他人是否知道自己知道他们知道自己是理性的。依此类推。例 6 选择越多（行动空间越大），对理性共识的要求越高。请看下例：例 7 四、纳什均衡许多博弈既不存在占优策略均衡，也不存在重复剔除的占优均衡。例 8 1、纳什均衡的定义如果存在这样一个策略组合——给定该策略组合中其他参与者的选择，没有人有积极性改变自己的选择，我们就说该策略组合是一个纳什均衡。交通规则问题就是一个很好的例子：例9：交通规则问题纳什均衡是一种一致预期：基于信念的选择是合理的；支持选择的信念是正确的。这种一致预期能够自我实现，不会出错：如何所有人认为这个结果会出现，这个结果就会出现。以交通规则问题为例，如果甲认为乙预期甲将靠右走，甲就确实会选择靠右走。 2、纳什均衡的意义如果某个策略组合为纳什均衡，那么任何一个参与者都没有激励独自背离他所选定的策略。这就是说，该策略组合是“策略稳定”或“自动实施”的。换一种说法，如果参与者事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。 3、严格纳什均衡与弱纳什均衡 4、用划线法求纳什均衡例 10 5、纳什均衡与重复剔除的占优均衡之间的关系命题一：纳什均衡不