02Nash均衡学案.pptVIP

下载本文档

3
0
约4.62千字
约 44页
2017-01-27 发布于湖北
举报
版权申诉

02Nash均衡学案.ppt

1、本文档共44页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

在相当多的博弈中，无法使用寻找占优战略和重复剔除劣战略的方法找出均衡解，例如新产品开发博弈中市场需求为低时的情形。为了找出更一般博弈的均衡解，需要引入Nash均衡(Nash equilibrium)的概念。定义5 ： Nash均衡在战略式博弈中，战略组合是一个Nash均衡当且仅当，，有 1.Nash均衡： Nash均衡是1994年诺贝尔经济学奖获得者John Nash在20世纪50年代，作为 n 人战略式博弈的解而提出来的，也是目前一致认可的博弈解。在传统的博弈论中，一般都将Nash均衡作为博弈的解。 Nash均衡是完全信息静态博弈的解的概念，一个战略组合如果不是Nash均衡解，就不能成为博弈的解。这意味着构成Nash均衡的战略是不可剔除的，即不存在任何一个战略严格优于Nash均衡战略。在“囚徒困境”中， (坦白，坦白)为Nash均衡。在“新产品开发博弈”中，市场需求大时，(开发，开发)为Nash均衡；市场需求小时，(开发，不开发)和(不开发，开发)为Nash均衡。 2. 求解Nash均衡的两种方法：划线法；箭头法； 1) 划线法 “划线法”就是利用Nash均衡的如下性质：在两人博弈中，相互构成最优战略的战略组合就是Nash均衡。具体步骤：考察参与人1的最优战略；用上述方法找出参与人2的最优战略；找出最优战略组合。新产品开发博弈——市场需求小 -4 0 0 , -4 0 0 2 0 0 , 0 0 , 2 0 0 0 , 0 企业 2 企业 1 开发不开发开发不开发 (开发，不开发)和(不开发，开发)为Nash均衡用划线法求解如下博弈 2) 箭头法 “箭头法”则是利用了Nash均衡这样的性质：在两人博弈中，一个战略组合只有在两个参与人都不愿意偏离的情况下才能构成Nash均衡。具体步骤：对于每个战略组合，检查是否有参与人会偏离这个战略组合；直至找出没有参与人会偏离的战略组合。用箭头法求解该博弈用箭头法求解该博弈关于Nash均衡，应注意以下几个问题： Nash均衡有强弱之分；每一个占优战略均衡、重复剔除的占优均衡一定是Nash均衡，但并非每一个Nash均衡都是占优战略均衡或重复剔除的占优均衡； Nash均衡一定是重复剔除严格劣战略过程中，没有被剔除的战略组合。但没有被剔除的战略组合不一定是Nash均衡，除非它是唯一的；纳什均衡有可能不唯一：此时哪一个是最优的呢？纳什均衡会导致不可置信的威胁存在：需要精炼。考虑如下博弈： 0 , 4 4 , 0 5 , 3 4 , 0 0 , 4 5 , 3 3 , 5 3 , 5 6 , 6 1 2 1 a 2 a 3 a 1 b 2 b 3 b Nash均衡主要内容：一、占优行为二、重复剔除劣战略行为三、Nash均衡引例：囚徒困境 “囚徒困境”博弈问题是Tucker在20世纪50年代提出的，该问题不仅“可以作为实际生活中许多现象的一个抽象概括”，而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。 “囚徒困境”(prisoners’ dilemma) 两个小偷作案后被警察抓住，分别关在不同的屋子里审讯。在审讯之前，小偷从律师那里得知：如果两个人都坦白，将被各判刑4年；如果两个人都抵赖，将会因为证据不足而各判1年；如果其中一人坦白另一人抵赖，坦白的将会得到宽大处理而被无罪释放，而抵赖的将被重判（6年）。试问两个小偷将会如何选择？ “囚徒困境”(prisoners’ dilemma) 对于每个小偷，当对方坦白时，自己坦白得-4，抵赖得-6，所以，应该选择“坦白”；而当对方抵赖时，自己坦白得0，抵赖得-1，所以，还是应该选择“坦白”。无论对方如何选择，每个小偷都会选择“坦白”。因此，博弈的结果就是两个小偷都选择“坦白”。第一个问题除了(坦白，坦白)以外，“囚徒困境”是否还会出现其它的结果呢? 比如说一个人坦白，另一个人抵赖？我们说这样的结果也是不会出现的，因为在对方选择“坦白”的情况下，自己选择“抵赖”显然是不理性的。第二个问题当两个小偷都选择“坦白”时，是否会有人偏离“坦白”而选择“抵赖” ? 两个小偷只要是理性的，这种情况就不会发生。无论对方如何选择，每个小偷都会选择“坦白”,可以发现战略“坦白”具有这样的特点：无论对方怎样选择(选择“坦白”或者“抵赖”)，“坦白”总是理性小偷的最优战略。规律： “囚徒