零和博弈-sugoocom.PPT

下载文档 降价啦

19
0
约5.39千字
约 39页
2017-08-23 发布于天津
举报
版权申诉
保障服务

零和博弈-sugoocom.PPT

1、本文档共39页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

零和博弈-sugoocom

第8章零和博弈定义和例题稳妥地参与：最大最小充分地参与：最小最大实施纳什均衡策略：既稳妥又充分地参与 1. 零和博弈零和博弈是这样的一个博弈，不管两个局中人采取的是什麽样的策略向量，他们的盈利总是相加为零；就是说，对所有的策略s1和s2，成立 ?1(s1, s2) + ?2(s1, s2) = 0? 在（两人）零和博弈中，局中人2的盈利正好是局中人1的盈利的负值。例1: 扔硬币打赌 1 \ 2 L C R U 5, -5 8, -8 4, -4 M -7, 7 9, -9 0, 0 D 9. -9 1, -1 -2, 2 例2: 壁球 1 \ 2 向前（F）后退（B）前面（f） 20，80 70，30 后面（b） 90，10 30，70 在每一格中，分别为局中人1和局中人2赢的百分比。例2是从任何角度都很象零和博弈的一类博弈中的一个例子。这类博弈称为常数和博弈。在这类博弈中，两个盈利合计总是等于常数。 2. 稳妥地参与：最大最小在零和博弈中，当且仅当局中人1干得差时，局中人2干得好。对于任意策略s1，存在局中人2可以选择的策略b(s1) ，使得他的盈利可能最高而同时使得局中人1的盈利最低。策略b(s1) 形式上定义为在选择自己最好的“最差盈利”时，重要的是局中人1完全有理由同时考虑混合策略。毕竟，回想起当我们研究壁球游戏时，我们发现稍许有点虚张声势会使局中人得处境好一些；如果她击球落点是在球场前面和后面之间的混合，她赢的百分比就会高一些。现在我们来给出保证盈利（或者最差情况下的最高盈利）的正式定义。这个盈利称为最大最小盈利并记为m1：如果策略p* 满足? [ p*, b(p*)] = m1，则称p*为局中人1的稳妥策略。注1：由于策略b(p)使得局中人1的盈利最小化，因此，它是局中人2对付p的最优反应（因此使用这个记号）。所以，稳妥的方法是，局中人预期她的对手采取最优反应并且防范任何随之发生的不利结局。注2：稳妥方法给予局中人1一个单方面手段去参与博弈。她知道，如果采取一个稳妥策略p*，她不可能比m1更差。如果事实上她的对手没有采用最优反应，那么她的盈利只能更高一些。这不像最优反应行为，该行为要求局中人1彻底地全面考虑问题：我在对什么作出最优反应？当然，这样的单方面策略的实施可能产生很高的代价；稳妥地参与可能不像采用最优反应那样有利。那种可能性将是下面小节的主题。 3. 充分地参与：最小最大代替采用防止最差情况结局，局中人1可以通过采用最优反应从而“更加积极地”对付局中人2的策略。人们可以认为这是更乐观的办法；试图预测对手的行动并且对此作出最优的反应。与之相联的概念称作最小最大盈利；它是局中人1的最优（反应）盈利中最差的一个（将它记为M1）：命题1 （最小最大优于最大最小）。局中人1的最小最大盈利至少和她的最大最小盈利一样高，即M1 ? m1。不管我们考虑的是纯策略或者是混合策略，该陈述都是正确的。命题2（一个局中人的最小最大是另一个局中人的最大最小）。局中人1的最小最大盈利正好是局中人2的最大最小盈利（的负值），即 M1 = - m2 = ? [b (q*),q* ] (反过来，局中人2的最小最大盈利是局中人1的最大最小盈利的负值。) 4. 实施纳什均衡策略：既稳妥又充分地参与定义: 一对混合策略，如果对所有纯策略s1和s2，有命题3（稳妥和充分地参与）。令构成零和博弈的纳什均衡。那么和是稳妥策略，并且最大最小（和最小最大）盈利互相相等且等于。反之，假使最小最大和最大最小盈利相等。那么稳妥策略构成了博弈的纳什均衡。第9章展开型博弈和后推归纳展开型策略，混合策略，和事件结完美信息博弈后推归纳法与策略型中IEDS的联系案例研究：“毒药”和其他收购威慑剧院博弈 1. 展开型为了让“树”描绘博弈，其结点和枝需要满足三条性质： 1．单一的出发点。重要的是知道博弈从何处开始，所以必须有一个，也只能有一个出发点。因而，如图11.3那样的情况是不允许的。? 2．无循环。重要的是在博弈运行中，我们不要陷入僵局；树枝循原路折回并造成一个循环一定是不可接受的。 3．单方向前进。重要的是，对于博弈如何进行下去不能模棱两可，因此，必定不存在二个或多个枝导向同一个结。为保证这三条性质，在前结点上强加下述限制： 1．结点不能是自身的前结点。 2．前结点的前结点也是前结点：如果结点?是?的前结点，依次结点?是?的前结点，那么?也是?的前结点。 3．前结点可以排序：如果?和?都是?的前结点，必定是或者?是?的前结点，或者反过来。 4．必定存在一个共