理论发展：混合战略和均衡的存在性.pptVIP

下载本文档

27
0
约7.6千字
约 48页
2017-09-09 发布于浙江
举报
版权申诉

理论发展：混合战略和均衡的存在性.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

理论发展: 混合战略和均衡的存在性 1.3.A 混合战略根据纳什均衡的定义，下图所示“猜硬币”的博弈是不存在纳什均衡的。为理解矩阵表中所列参与者各自的收益，设想每一参与人拿有一枚硬币，并必须选择是出正面向上还是背面向上。若两枚硬币是一致的(即全部正面向上或全部背面向上)，则参与人2赢走参与人1的硬币;如果两枚硬币不一致(一正一反)，参与人1赢得参与人2的硬币。在此博弈中，没有一组战略能够满足纳什均衡的条件。猜硬币博弈一个非常突出的特点是每个参与者都试图能先猜中对方的战略。这一类博弈在扑克、战争等其他环境中也经常会发生。在用扑克牌赌博的博弈中，类似的问题是如何决定使诈的次数:如果大家都知道参与者i是从来不使诈的，那么任何时候当i下很高的赌注时他的对手就会认输，但这又使得i偶然使诈会有利可图;另一方面，使诈次数过多亦非上策。与之相似，在战争中，假设进攻方可能在两个攻击点(或两条进攻路线，比如“陆路或水路”)中选择其一，防御方可以抵御来自任一方向的攻击，但也只在它正确预测到进攻路线的前提下。在博弈中，一旦每个参与者都竭力猜侧其他参与者的战略选择，就不存在前面所定义的纳什均衡，因为这时参与者的最优行为是不确定的，而博弈的结果必然要包含这种不确定性。现在引入混合战略的概念，我们可以将其解释为一个参与者对其他参与者行为的不确定性。规范地表述，参与者i的一个混合战略是在其战略空间Si中(一些或全部)战略的概率分布，此后我们称Si中的战略为i的纯战略(pure strategies )。对完全信息同时行动博弈来说，一个参与者的纯战略就是他可以选择的不同行动。例如在猜硬币博弈中，Si内含有两个纯战略，分别为正面和背面，这时参与者i的一个混合战略为概率分布(q,1-q) ,其中q为出正面向上的概率，1一q为出背面向上的概率，且0≤q ≤ 1。混合战略（0，1）表示参与者的一个纯战略，即只出背面向上。类似地，混合战略（1，0）表示只出正面向上的纯战略。作为混合战略的第二个例子，请回顾图1.1.1所示博弈，参与者2有三个纯战略:左、中、右，这时他的一个混合战略为概率分布(q,r,1-q-r)，其中q表示出左的概率，r表示出中的概率，1-q-r表示出右的概率.和前面相同，0≤q ≤ 1，0 ≤ r ≤ 1，0 ≤ q+r ≤ 1。在此博弈中，混合战略(1/3，1/3，1/3)表示参与者出左、中、右的概率相同，而(1/2,1/2,0)表示出左、中的概率相同，但绝不可能选择出右。和在所有情况下一样，参与者的一个纯战略只是混合战略的一种特例，例如参与者2只出左的纯战略可表示为混合战略(1,0,0)。更为一般地，假设参与者i有K个纯战略:Si={si1,...,sik}，则参与者i的一个混合战略是一个概率分布(pi1,...,pik)，其中pik表示对所有k=1，...，K，参与者i选择战略sik的概率。由于pik是一个概率，对所有k=1,...,k,有0≤pik ≤ 1且pi1+...+pik=1。我们用pi表示基于Si的任意一个混合战略，其中包含了选择每一个纯战略的概率，正如我们用si表示Si内任意一个纯战略。定义对标准式博弈G={S1,...,Sn;u1,...,un},假设Si={si1,...,sik},那么，参与者i的一个混合战略为概率分布pi=(pi1,...,pik)，其中对所有k=1,...,k,0≤pik ≤ 1，且pi1+...+pik=1。对于严格劣战略，前面曾讲到，如果战略si为严格劣战略，那么参与者i不可能作出这样的推断(针对其他参与者的战略选择):他的最优反应战略会是si。如果我们引入混合战略，就可证明其逆命题:如果(针对其他参与者的战略选择)参与者i都不可能作出这样的推断:其战略si会成为最优反应战略，则一定存在另一战略严格优于si。图1.3.1和图1.3.2所示博弈说明了，如果我们只讨论纯战略，这一逆命题是不成立的。图1 .3.1显示出，一个给定的纯战略可能会严格劣于一个混合战略，即使这个纯战略并不严格劣于其他任何一个纯战略。在这一博弈中，针对参与人1对参与人2可能行动所作出的任何推断( q, 1一q)，1的最优反应要么是T(在q=1/2时)，要么是M(在q=1/2时)，但不会是B，虽然T或M都不严格优于B。这里的关键在于B是T和M的一个混合战略的严格劣战略:如果参与者1以1/2的概率出T，以l/2的概率出M，则其期望收益为3/2，不管2将会选择什么(纯的或混合的)战略，3/2都大于选择B时将得到的收益1。这个例子说明了在“寻找另外一个严格优于的战略”时，混合战略所起的作用。图1.3.2说明了一个给定的纯战略可以是针对一个混合战略的最优反应，即使这一纯战略并不是对方任何