- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲、笑完全信息静态博弈
第二讲、完全信息静态博弈 完全信息静态博弈:纳什均衡 纳什均衡是著名博弈论专家纳什(John Nash)对博弈论的重要贡献之一。 纳什在19世纪50年1951年的两篇重要论文中,在一般意义上给定了非合作博弈及其均衡解,并证明了解的存在性。正是纳什的这一贡献奠定了非合作博弈论的理论基础。纳什所定义的均衡称之谓“纳什均衡”。在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。 一、占优策略均衡 占优策略(dominant strategies)是指这样一种特殊的博弈:某一参与人的策略可能并不依赖于其他参与人的策略选择。换句话说,无论其他参与人如何选择自己的策略,该参与人的最优策略选择是惟一的。 (一)囚徒困境 囚徒困境现实中的例子 政治学例子:军备竞赛 在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。 囚徒困境模型的延伸 罗伯特·阿克塞尔罗德在其著作《合作的进化》中,探索了经典囚徒困境情景的一个扩展,并把它称作“重复的囚徒困境”(IPD)。在这个博弈中,参与者必须反复地选择他们彼此相关的策略,并且记住他们以前的对抗。 阿克塞尔罗德发现,采用“宽恕地以牙还牙”策略。当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪”策略趋向于减少,而比较“利他”策略更多地被采用。他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。 二、重复剔除的占优策略均衡 在每个参与人都有占优策略的情况下,占优策略均衡是非常合乎逻辑的。但遗憾的是在绝大多数博弈中,占优策略均衡是不存在的。不过,在有些博弈中,我们仍然可以根据占优的逻辑找出均衡。 智猪博弈(boxed pigs)是博弈论中的另一个著名的例子。 智猪博弈的现实例子 智猪博弈听起来似乎有些滑稽,但智猪博弈的例子在现实中确有很多。 例一、股市上等待庄家抬轿的散户、 等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资,公司里不创造效益但分享成果的人 智猪博弈模型的延伸思考 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的现象吗? 三、纳什均衡 前面我们讨论了占优策略均衡和重复剔除的策略均衡。但是在现实生活中,还有相当多的博弈,我们无法使用占优策略均衡或重复剔除的策略均衡的方法找出均衡解。 表2-3 性 别 战 的 收 益 矩 阵 改变方案三:减量加移位方案。投食仅为原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是,对于社会而言,因为小猪未能参加竞争,小猪搭便车时的社会资源配置得并不是最佳状态。为使资源最有效配置,规则得设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”。如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力——就像“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就像改变方案三——减量加移位的方法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”的现象,能实现有效的激励。 例如,在房地产开发博弈中,假定市场需求有限,A、B两个开发商都想开发一定规模的房地产,但是市场对房地产的需求只能满足一个房地产的开发量,而且,每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下,无论是对开发商A还是开发商B,都不存在一种策略优于另一种策略,也不存在严格劣策略:如果A选择开发,则B的最优策略是不开发;如果A选择不开
文档评论(0)