博奕论特点、原则与对策行为.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论和对策行为 性别战在经济学上的应用 下表是两个竞争企业是否推出新产品的利益矩阵。 这个博奕中有两个纳什均衡:一家推出新产品,一家无新产品。推出新产品的企业赢利为10,无新产品的企业赢利为-5。究竟是企业1还是企业2赢利,要看是哪一家企业首先行动。假定企业1具有较高的研究和开发优势,率先在市场上推出新产品,那么企业2的最佳反应就是不跟进,因为跟进的损失是7,不跟进的损失只有5。 企业2 无新产品 推出新产品 企业1 无新产品 2,2 -5,10 推出新产品 10,-5 -7,-7 博弈论和对策行为 优超解 如果一个局中人在任何情况下从某种策略中得到的收益均大于从其它策略中得到的收益,那么对他而言,这个策略称为优超策略或支配性策略(dominant strategy)。其它的策略称为被优超策略或被支配策略(dominated strategy)。 博弈论和对策行为 优超解 在囚徒博奕中,对囚徒A来说,“抵赖”被“坦白”优超,对囚徒B也同样,所以,(坦白,坦白)就是一个优超策略均衡。在这个例子中,优超策略均衡也就是纳什均衡。 当有一名局中人具有优超策略时,博奕总会有一个纳什均衡,因为当该局中人采取优超策略时,另一局中人就会据此做出自己的最优反应。但纳什均衡不一定是优超策略均衡。 博弈论和对策行为 优超解 在市场进入阻挠博奕中,在位者有一个优超解“默许”,进入者对默许的最优反应是“进入”,所以,(进入,默许)是一个纳什均衡。 大多数的博奕局势中利用优超概念只能够对博奕问题进行简化,得不到对策解。 博弈论和对策行为 优超解 例2:考虑由下表给出的策略性博奕: 局中人B u v x 3,6 7,1 局中人A y 5,1 8,0 z 6,0 6,2 博弈论和对策行为 优超解 对于局中人A来说,策略x被y优超了,所以,可以删去x使问题简化为: 局中人B u v 局中人A y 5,1 8,0 z 6,0 6,2 但是,对这个简化了的博奕,我们仍然无法找到对策解。有些博奕问题既没有优超均衡解,也没有纳什均衡解。 博弈论和对策行为 最大最小策略(Max-min strategy) 冯.诺依曼和摩根斯坦认为策略的选择与决策者的性格有关。 某些决策者可能认为,冒失行动容易造成重大失误,最好还是从最不利的情况出发,向最好的方向努力,力求做到有备无患。这样的决策者属于风险厌恶型的,他首先想到的是各种不利因素和风险,所以他先要考虑各种最坏的结果,然后从最坏结果中选出一个最好结果。按这种原则选取的策略可以称为最大最小策略。 博弈论和对策行为 混合策略和重复性博弈 策略有两种概念,前面我们所说的策略,都是纯策略,另一种策略概念为在纯策略基础上形成的混合策略(mixed strategy)。 局中人I的混合策略αi是他的纯策略空间Si上的一种概率分布,表示局中人实际对策时根据这种概率分布在纯策略中随机选择加以实施。 博弈论和对策行为 混合策略和重复性博弈 为了叙述问题方便,下面我们主要讨论二人零和博奕。 零和对策是策略型对策的最基本模式,其中局中人得失的总和为零(或为一常数)。二人零和博奕是指零和博奕中有且只有两个局中人,一人的所得正是另一人的所失。二人零和对策在博奕论的早期发展中曾占有过重要地位。 二人零和博奕的支付矩阵可以记为: 局中人B b1 b2 a1 α11 α12 a2 α21 α22 如果支付矩阵的数值αij为正时,表示局中A的赢得值,若支付矩阵的数值αij为负时,表示局中A的损失或输掉的值。 博弈论和对策行为 混合策略和重复性博弈 例:二人零和博奕的收益矩阵如下表,局中人A的收益值均为正,而局中人B的收益值均为负,即表示局中人B的损失值。 局中人B b1 b2 局中人A a1 1,-1 4,-4 a2 3,-3 2,-2 博弈论和对策行为 混合策略和重复性博弈 如果每个局中人完全清楚地知道对手将会采取什么样的策略,会是什么情况呢?A如果知道B会选择b1,则会选择a2;当A连续使用策略a2时,B必定会察觉,便会选择b2;当B连续使用b2时,A也会察觉,从而改为选择a1;B如果知道A选择了a1,则又会选择b1;如此反复,以至无穷,所以,双方如果使用纯策略进行博奕时,就会出现不稳定状态,不会有最终的均衡结果。这说明双方都不能连续不变地使用某种纯策略,都必须考虑如何随机地使用自己的策略,使对方捉摸不到自己使用何种策略。这就需要混合策略的对策。 博弈论和对策行为 混合策略和重复性

您可能关注的文档

文档评论(0)

beautyeve + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档