第2讲 完全信息静态博弈.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 完全信息静态博弈 占优策略均衡** 重复剔除的占优均衡** 纳什均衡*** 经济模型的纳什均衡解释* 混合策略纳什均衡** 纳什均衡的存在性和多重性 一般来说,由于每个参与人的效用依赖于所有人的选择,因此每个人的最优选择(策略)也依赖于所有其他人的选择(策略)。 然而在囚徒困境中,一个人的最优选择并不依赖于他人的选择。这样的最优策略,也就是“占优策略”(dominant strategy)。与之相对的其他策略则为劣势策略。由所有参与人的占优策略构成的策略组合被称为“占优均衡”。 占优策略:“不管你怎么做,我所做的都是我能做得最好的。”简单地说,占优策略就是以不变应万变。 2、举例:囚犯困境(Prisoner`s dilemma) 经典的囚犯困境 占优策略的原则:如果一个博弈参与者拥有一个占优策略,则应该使用之。 我们再用一个广告例子来说明这个原则。两家公司, A和B,在考虑是否通过广告促销。它们的利润额将依赖于那一家公司做广告, 或者两家公司都做广告, 或者两家公司都不做广告。这些可能性和相应的利润额被总结在旁边的矩阵里(如图)。 观察: 对A,无论B怎么做,做广告都是最优的。所以做广告是A的占优策略。对B:无论A怎么做,做广告也都是最优的, 所以做广告也是B的占优策略。结论: 两家厂商都应该做广告。 在每个参与人都有占优策略的情况下,占优策略均衡是非常合乎逻辑的。但遗憾的是在绝大多数博弈中,占优策略均衡是不存在的。不过,在有些博弈中,我们仍然可以根据占优的逻辑找出均衡。 “重复剔除严格劣策略” 逻辑思路如下:首先找出某参与人的严格劣策略,将它剔除,重新构造一个不包括已剔除策略的新博弈;然后,继续剔除这个新的博弈中某一参与人的严格劣策略;重复进行这一过程,直到剩下惟一的参与人策略组合为止。剩下的话这个惟一的参与人组合,就是这个博弈的均衡解,称为“重复剔除的占有策略均衡”。 2、举例 智猪博弈:多劳不多得 智猪博弈:多劳少得 许多博弈没有占优均衡,也没有重复剔除的占优均衡。考虑如下博弈: 纳什均衡是指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。 纳什均衡:”对于给定其他参与者的行为, 每个参与者的行为都应该是最优。” “给定你的做法后,我所做的是我能做得最好的。” 如果你有占优策略, 你可以使用此策略, 以不变应万变; 如果你没有占优策略, 你必须随机应变。在达到了纳什均衡之后, 所有参与者都没有动机想再变了。 占优策略:“不管你怎么做,我所做的都是我能做得最好的。 构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略。但没有被剔除的战略组合不一定是Nash均衡,除非它是唯一的。 求解Nash均衡的两种方法: 第一,“划线法”。 这就是利用Nash均衡这样的性质:在两人博弈中,相互构成最优策略的策略组合,就是Nash均衡。 划线法具体步骤如下: 第一步,考察参与人1的最优策略。 第二步,用上述方法找出参与人2的最优策略。 第三步,找出最优策略组合。 用划线法求解该博弈 第二,“箭头法” 利用了Nash均衡这样的性质:在两人博弈中,一个策略组合只有在两个参与人都不愿意偏离的情况下才能构成Nash均衡。 箭头法具体步骤如下: 对于每个策略组合,检查是否有参与人会偏离这个策略组合。 找出没有参与人会偏离的策略组合。 用箭头法求解该博弈 寻找纳什均衡 3、应用分析 关于纳什均衡的哲学思考 如果参与人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。 “给定你的做法后,我所做的是我能做得最好的。” 上述博弈的显著特征:每一个参与人都想猜透对方的策略,而每一个参与人又都不能让对方猜透自己的策略。 纳什50年前就已经证明此类博弈,如果允许混合策略存在的话,是存在纳什均衡的,称之为“混合策略均衡”。 混合策略指的是参与人以一定的概率选择其策略。比如说:参与人以0.3的概率选择第一种策略,以0.5的概率选择第二种策略,以0.2的概率选择第三种策略。 如果一个参与人采取混合策略,其对手就不能准确地猜出这个参与人实际会选择的策略。 如果一个策略规定参与人在每一个特定的信息情况下只选择一种特定的行动,称该策略为纯策略。 反之,如果一个策略规定参与人在给定的信息情况下以某种概率分布随机的选择不同的行动,称该策略为混合策略。 在静态博弈中,纯策略等价于特定的行动,混合策略是不同行动之间的随机选择。 纯策略可以理解为混合策略的特例。 混合策略的特点 自己的选择不能让对手预先知道 若重复多次,则不让对手发现其中的规律。 混合策略的原则: 自己的策略选择不能被另一方预知或猜到。即在

您可能关注的文档

文档评论(0)

beoes + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档