课件:三零和游戏与混合策略.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
案例——夫妻博弈 丈夫和妻子商量晚上的活动。丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜晚。 这个“夫妻博弈”有两个纳什均衡点:(歌剧,歌剧),(拳击,拳击)。 有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在“夫妻博弈”中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。 在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。纯策略的纳什均衡只是博弈的一种特例。 所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。纯策略是参与者一次性选取的,并且坚持他选取的策略。 纳什定理与混合策略 所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。混合策略是参与者在各种备选策略中采取随机方式选取的。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。 THANK YOU SUCCESS * * 可编辑 最常见混和策略就是猜硬币游戏。比如在足球比赛开场,裁判将手中的硬币让双方队长猜正反面。由于硬币落下是正是反是随机的,概率都是1/2。那么,猜硬币游戏的参与者都是1/2的概率择正与反,这时博弈达到混和策略纳什均衡。 纳什定理与混合策略 “剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取出“剪”、“布”还是“锤”的策略应当是随机的。因此,每个小孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。 纳什定理与混合策略 两个不到十岁的小男孩,一起玩的时候发生争执,两人商量用‘剪刀、石头、布’,谁赢就听谁的。下面是他们的对话: 甲说:“喂,咱们俩是好兄弟,非要分出胜负就太伤和气了。待会儿咱们都出‘剪刀’就算了事了,好不?” 乙说:“没问题,好兄弟嘛! ” 他们说话的时候一脸的纯真。 结果——甲出的是石头,乙出的是布。 纳什定理与混合策略 随机策略 随机策略的最广泛用途在于以较低的监管成本促使人们遵守规则,同时解释了惩罚不一定要和罪行吻合的原因。 违章停车的罚金是正常收费标准的许多倍。设想一下,假如正常收费标准是1美元/小时,按每小时1. 01美元的标准进行处罚能不能让大家服服帖帖呢?有可能,条件是交通警察在你违章停车时一定能逮住你。而这需要大量的交警,费用巨大。 监管当局有一个同样管用、代价又小的策略,就是提高罚金数目,同时放松监管力度。 假如监管属于随机性质,我们必须定出一个超过罪行本身的惩罚。规则在于,预期的惩罚应该与罪行相称,而这种心理预期应该将被逮住的概率考虑在内。 国税局的审查策略也是随机策略 混合策略 公司年饭抽奖,老板提出,今年特别奖不用抽签而是用玩游戏的方式来决定。 游戏规则:大家围成一圈同时跟老板猜拳,猜赢老板或是平手的人可以参予比赛,猜输的就没有参赛资格。参赛者一直猜到剩下最后一个就是赢家而获得该奖项。 如果你是该公司的员工,你如何增大你拿奖的概率? 立刻跟两位同事商量:三个人合作,得到奖项大家平分。 大家讲好第一次大家都出不一样的。至少确定第一回合之后,接着还会剩下两个人能够参予这个游戏。 位置博弈 麦当劳和肯德基为什么总是相邻设店? 位置博弈 他们为什么总喜欢贴身撕杀? 位置博弈 假设有条完全笔直的公路,连接城市A到城市B之间的交通。这条公路上每天行驶着大量的车辆,并且车流量在公路上是均匀分布的。假设麦当劳和肯德基要在这条公路上选择一个位置,招揽来往车辆。 一个合乎逻辑的假定:通常情况下,车辆总是乐意到距自己最近的快餐店购买食物。 1/4麦当劳 3/4肯德基 1/2 0 A 1 B 从资源的最佳配置来看,麦当劳、肯德基应该分别开在1/4、3/4处是最优。在这种均匀散布的情况下,每家快餐店所有拥有的客户从距离最近的城市到两家快餐店的中心为止,因此都拥有1/2的顾客量,同时对于开车的人们总体来说,这种策略的选择,车辆到快餐店的总的距离最短。 位置博弈 1/4麦当劳 3/4肯德基 1/2 0 A 1 B 肯德基与麦当劳都是百年老店,自然是精明之至,从经济学上就是具有经济理性,总是希望自己的生意尽可能地红火,至于其他人的生意的好坏则与己无关。 出于这种理性,肯德基肯定会想到:如果将店铺从3/4点处向左移一点,将从麦当劳抢夺走部分顾客,这对于肯德基单方面来说无疑是一个好主意。 当然麦当劳也不甘示弱,作为一个“理性人”,麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。 不难想象,双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态,甲乙两人相依为邻且相安无事地做起快餐生意。 即使不是两家快餐店,而是很多家快餐店,也很容易分析得到结果:这些快餐店仍然会在1/2处设店达到纳什均衡。 位置博弈 同样

文档评论(0)

iuad + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档