- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北大精品课件:《博弈论与公共政策》之完全信息静态博弈
博弈论与公共政策 北大精品课件 完全信息静态博弈 主要内容 一、博弈的标准式表述 二、占优策略均衡 三、重复剔除的占优均衡 四、纳什均衡 五、多重纳什均衡的比较 六、混合策略 七、应用举例 何谓静态博弈? 开始时由参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果。 何谓完全信息静态博弈? 每一参与者的收益函数在所有参与者之间是共同知识。 一、博弈的标准式表述 博弈的标准式表述包括三个方面的内容: (1)博弈的参与者 (2)每个参与者可供选择的策略集 (3)针对所有参与者可能选择的策略组合,每个参与者获得的收益 对于一个 n 人博弈,设各参与者的策略空间依次为 S1,S2, …,Sn ,收益函数分别为u1,u2, …,un ,其中 ui (s1,s2, …,sn) 为参与者选择策略组合 (s1,s2, …,sn) 时参与者 i 的收益,则可用标准式将该博弈表示如下: G = {S1,S2, …,Sn ; u1,u2, …,un } 在双人有限策略的情况下,可以用双变量矩阵更直观地表述博弈。 例1:囚徒困境 但是,如果参与者超过2人,则用双变量矩阵形式来表示博弈就不那么方便了,甚至根本无法采用这种形式。 例2:三人有限策略博弈 二、占优策略均衡 1、占优策略 在博弈中,如果不管其他参与者选择什么策略,某个参与者的特定策略都优于或至少不劣于其他所有策略,那么,我们就说这个特定策略是该参与者的占优策略。 在前面的囚徒困境博弈中,“招认”就是每个囚徒的占优策略。 2、占优策略均衡 如果每个参与者都存在占优策略,那么由这些占优策略构成的组合就称为占优策略均衡。 在前面的囚徒困境中,(招认,招认)就构成一个占优策略均衡。 注意: 占优策略均衡只要求每个参与者是理性的,而并不要求每个参与者知道其他参与者是理性的,也就是说,不要求“理性”是共同知识。 例3:公共产品的供应问题 A、B两人同住一室,现在,他们考虑是否购买一台电视机。电视机的价格为4000元,每个人从看电视中获得的效用各为3000元。 假定他们根据下列程序决定是否购买电视机: 每人把是否购买电视机的想法写在一张纸条上,如果两人都认为应该购买,则平均分担购买电视机的费用。如果两人都认为不应该购买,则不购买电视机。如果只有一人提出购买而另一人不想购买,则由提出购买的人独自购买电视机。 每个人会如何决策? 三、重复剔除的占优均衡 1、重复剔除的占优均衡 首先从某一参与者的策略集里剔除掉一个劣策略,再重新考察各个参与者剩下的策略中哪些是劣策略并剔除其中之一,不断继续这一过程直到每个参与者都仅剩一个策略为止,最后得到的策略组合就称为重复剔除的占优均衡。 例4:俾斯麦海之战 在单人决策中,当所有情况下的收益都增加(至少不减少)时,当事者的境况不会变得更坏,但在博弈中则未必。比较下面的两个博弈: 例 5 2、理性共识 重复剔除的占优均衡不仅要求每个参与者是理性的,而且要求“理性”是参与者的共同知识,即参与者具有“理性共识”(Common Knowledge of Rationality,简记为CKR)。 理性共识可划分为不同的层次: 零阶理性共识:每个人都是理性的,但不知道其他人是否理性。 一阶理性共识:每个人是理性的,并且知道其他人也都是理性的,但并不知道其他人是否知道自己是理性的。 二阶理性共识:每个人是理性的,也知道其他人都是理性的,而且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道他们知道自己是理性的。 依此类推。 例 6 选择越多(行动空间越大),对理性共识的要求越高。 请看下例: 例 7 四、纳什均衡 许多博弈既不存在占优策略均衡,也不存在重复剔除的占优均衡。 例 8 1、纳什均衡的定义 如果存在这样一个策略组合——给定该策略组合中其他参与者的选择,没有人有积极性改变自己的选择,我们就说该策略组合是一个纳什均衡。 交通规则问题就是一个很好的例子: 例9:交通规则问题 纳什均衡是一种一致预期:基于信念的选择是合理的;支持选择的信念是正确的。 这种一致预期能够自我实现,不会出错:如何所有人认为这个结果会出现,这个结果就会出现。 以交通规则问题为例,如果甲认为乙预期甲将靠右走,甲就确实会选择靠右走。 2、纳什均衡的意义 如果某个策略组合为纳什均衡,那么任何一个参与者都没有激励独自背离他所选定的策略。这就是说,该策略组合是“策略稳定”或“自动实施”的。 换一种说法,如果参与者事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。 3、严格纳什均衡与弱纳什均衡 4、用划线法求纳什均衡 例 10 5、纳什均衡与重复剔除的占优均衡之间的关系 命题一: 纳什均衡不
文档评论(0)