纯策略纳什均衡（2）.docVIP

下载本文档

70
0
约2.71千字
约 8页
2020-10-21 发布于广东
举报
版权申诉

纯策略纳什均衡（2）.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE PAGE 1 纯策略纳什均衡纯策略纳什均衡（Pure Strategy Nash Equilibrium） [编辑] 什么是纯策略纳什均衡　　纯策略纳什均衡是指在一个纯策略组合中,如果给定其他的策略不变，该节点不会单方面改变自己的策略，否则不会使节点访问代价变小。 [编辑] 存在纯策略纳什均衡的有限次重复博弈[1] 　　如果重复博弈中有惟一纯策略纳什均衡，那么我们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒的困境的博弈的例子：　　我们现在考虑该博弈重复两次的重复博弈，这可以理解成给囚徒两次坦白机会，最后的得益是两个阶段博弈中各自得益之和．在两次博弈过程中，双方知道第一次博弈的结果再进行二次博弈．用逆推归纳法来分析，先分析第二阶段，也就是第二次重复时两博弈方的选择．很明显，这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈，此时前一阶段的结果已成为既成事实，此后又不再有任何的后续阶段，因此实现自身当前的最大利益是两博弈方在该阶段决策中的惟一原则．　　因此我们不难得出结论，不管前一次的博弈得到的结果如何，第二阶段的惟一结果就是原博弈惟一的纳什均衡(坦白，坦白)，双方得益(-5，-5)．　　现在再回到第一阶段，即第一次博弈．理性的博弈方在第一阶段就对后一阶段的结局非常清楚，知道第二阶段的结果必然是(坦白，坦白)，因此不管第一阶段的博弈结果是什么，双方在整个重复博弈中的最终得益，都将是第一阶段的基础上各加-5．因此从第一阶段的选择来看，这个重复博弈与图l中得益矩阵表示的一次性博弈实际上是完全等价的．　　于是我们可以得出惟一纯策略均衡的有限次重复博弈的结果就是重复原博弈惟一的纯策略纳什均衡，这就是这种重复博弈惟一的子博弈完美纳什均衡路径．　　如果重复博弈中有多个纯策略纳什均衡，设某一市场有两个生产同样质量产品的厂商，他们对产品的定价同有高(H)、中(M)、低(L)三种可能．设高价时市场总利润为10个单位，中价时市场总利润为6个单位，低价时市场总利润为2个单位．再假设两厂商同时决定价格，价格不等时低价格者独享利润，价格相等时双方平分利润．这时候两厂商对价格的选择就构成了一个静态博弈问题．我们看一个三价博弈的重复博弈的例子：　　显然，这个得益矩阵有两个纯策略纳什均衡(M，M)和(L，L)，我们也可以看出实际上两博弈方最大的得益是策略组合(H，H)，但是它并不是纳什均衡．现在考虑重复两次该博弈，我们采用一种触发策略(Trigger Strategy)：博弈双方首先试图合作，一旦发觉对方不合作也用不合作相报复的策略．使得在第一阶段采用(H，H)成为子博弈完美纳什均衡，其双方的策略是这样的：　　博弈方1：第一次选H；如果第一次结果为(H，H)，则第二次选M，如果第一次结果为任何其他策略组合，则第二次选择L．　　博弈方2：同博弈方1．在上述双方策略组合下，两次重复博弈的路径一定为第一阶段(H，H)，第二阶段(M，M)，这是一个子博弈完美纳什均衡路径．因为第二阶段是一个原博弈的纳什均衡，因此不可能有哪一方愿意单独偏离；其次，第一阶段的(H，H)虽然不是原来的博弈纳什均衡，但是如果一方单独偏离，采用M能增加1单位得益，这样的后果却是第二阶段至少要损失2单位的得益，因为双方采用的是触发策略，即有报复机制的策略，因此合理的选择是坚持H．这就说明了上述策略组合是这个两次重复博弈的子博弈完美纳什均衡．　　从上述的例子我们可以看出，有多个纯策略纳什均衡的博弈重复两次的子博弈完美纳什均衡路径是，第一阶段采用(H，H)，第二阶段采用原博弈的纳什均衡(M，M)．　　如果这个重复博弈重复三次，或者更多次，结论也是相似的，仍然用触发策略，它的子博弈完美纳什均衡路径为除了最后一次以外，每次都采用(H，H)，最后一次采用原博弈的纳什均衡(M，M)． [编辑] 存在纯策略纳什均衡的无限次重复博弈[1] 　　与有限次重复博弈一样，无限次重复博弈也是基本博弈的简单重复，但是无限次重复博弈没有最后一次重复，因此无限次重复博弈与有限次有一些不同．　　任何博弈中博弈方策略选择的依据都是得益的大小，这在重复博弈中仍然是成立的．但是重复博弈又与一次性博弈有所不同，因为在重复博弈中，每一阶段都是一个博弈，并且各博弈方都有得益，因此对于重复博弈，我们要计算的就是博弈结束时的一个总的得益．由于前一次博弈和后一次博弈之间会有损失，因此我们采用一种方法，就是将后一阶段的得益折算成当前阶段得益的(现在值)的贴现系数δ．有了贴现系数δ，那么在无限次重复博弈中，某博弈方各阶段得益为π1,π2,...,则该博弈方总得益的现在值为：　　　　对于存在惟一纯策略纳什均衡博弈的无限次重复博弈，我们从下面的例子来看：　　其中博弈方1和博弈方2分别表示两个厂商，H和L分别表