纳什理论.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
纳什理论

纳什理论 纳什均衡理论和博弈理论 在现代生活中,博弈论越来越广泛地用在经济、军事等领域,从数学的神殿中走入现实生活。博弈论成为聪明理智的决策者认识、研究和解决现代市场经济条件下冲突与合作的利器,被人们称作“纪念人类文明发展的十八座里程碑”。 博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。 一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。 纳什均衡理论的论述:一个非合作博弈是有这样一组博弈者进行的,每个博弈者有一套策略和得益函数。当各个博弈者的策略在其他博弈者的策略确定时使自己的得益最大。纳什认为理性博弈者之间的讨价还价最终导致一个唯一的结果。通过公理方法和非合作模型解,纳什求证了唯一解问题。 在不变威胁的情况下,每方都可选择对对方施加多大的压力。博弈论现在既要决定博弈者不同意提议时使用的威胁,又要确定将达成的协议。确定理论的公理相当于假定每个博弈者都有一个最优威胁策略,即假设这个问题存在一个结论。地二个公理是说一个博弈者不能通过去掉他的某些策略而提高得益。在非合作方法里纳什假设博弈者首先忠于自己的威胁。每组威胁都导致一个(不变威胁讨价还价)子博弈。其中选定了效用最大的那个均衡。反向并使用这一选择(即唯一解取代各个子博弈),第一阶段的威胁策略就转化为一个严格竞争博弈,即第一阶段转化博弈的均衡具有最小化的最大特征。结果整个博弈就有一个值以及最优策略。就是唯一解。 纳什的文章把此内容称为“两人合作博弈”,因为它本质上依托于存在一个仲裁者,强制实施合约与责任。纳什写道:“威胁成功的必要条件是,b不妥协时,a被迫实施威胁;否则就无多大的意义。因为一般来说,a想要的并不是实施威胁。”(1953.two-person cooperative games. Econometrica) “囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是坦白从宽,抗拒从严,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。   在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。 囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个攻守同盟,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。 三个囚徒的故事 关于博弈论,流传最广的是一个叫做“囚徒困境”的故事。 说的是有两个人,纵火之后逃跑被警察抓住了。因为证据不够充分,法官分别对他们说,如果你招了,他不招,那么你会作为证人而被无罪释放,他将被判15年徒刑;如果你招了,他也招了,你们都被判10年;如果你不招,他招了,他被无罪释放,你被判15年,如果你们都不招,各判一年。 这两个人都会做这样一个盘算过程:假如他招了,我不招,得坐15年监狱,招了才10年,所以招了划算;假如他不招、我不招,坐一年监狱(这显然不行,因他们无法串供),如果招了,马上获释,也是招了划算。综合以上两种情况考虑,还是招了划算。 最终,两个人都选择了招,结果都被判10年刑期。 这个故事说明,在一个集体里,有可能每个人都是理性的选择,但对于整个集体来说却是不理性的。而传统经济学认为市场经济有一只“看不见的手”,每个人的理性选择最终会造成对整个集体的最大利益。问题是,就像囚徒困境一样,这只看不见的手

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档