纳什均衡理论资料.ppt

下载文档 降价啦

4
0
约2.31千字
约 22页
2017-07-06 发布于湖北
举报
版权申诉
保障服务

纳什均衡理论资料.ppt

1、本文档共22页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

纳什均衡理论与上大学生的发展策略郁松年一场海战你死我活的对策日方盟军航行北线航行南线搜索北线 2天 2天搜索南线 1天 3天鞍点的重要性：局中人都不能由单方面背离它而做出改进。称鞍点为“纯策略”对策的一个“解”。所谓“纯策略”即按规定总是采取相同的行动。否则，为“混合策略”。石头－纸－剪刀对策的支付矩阵 Max Min 纸剪刀石头纸 0 －1 1 剪刀 1 0 －1 石头－1 1 0 几点说明行极小（-1）的极大值不等于列极大（+1)极小值；因此，对策没有鞍点。意味着如果Max “偷看”，他能获得超过Min的好处，因此总能获胜。具有等可能性选择的混合策略是该对策的一个“平衡点”。冯.诺伊曼(John von Neumann，美国数学家，1903~1957)在1928年发表了著名的极小极大定理，断言对每个两人零和对策每个局中人都有一个最优混合策略。极大极小定理对于每个两人零和对策，每个局中人都存在一个混合策略使得双方的期望支付有相同的值v。且是每一方能得到的最优支付；因此，相应的混合策略是每方所用的最优策略。一个零和对策的支付矩阵局中人 B 局中人 A B－1 B－2 A－1 0 5／6 A－2 1 1／2 可以证明：用A-1策略对局的概率为3/8, 用A-2策略对局的概率为5/8, A方将得到5/8的期望支付. 用B-1策略对局的概率为1/4，用B-2策略对局的概率为3/4， B方将得到-5/8的期望支付. 大致而言，纳什所做的研究工作就是证明了一条定理，该定理把极小极大定理推广到有两个或更多个直接竞争的局中人的非零和对策——即“非合作对策”的情形。〈纳什定理〉（美国数学家，John Nash,1928~)每个局中人有有限个纯策略的任一个n人非合作策略（零和或非零和）至少有一个策略平衡组。（注）：纳什引进了平衡对的概念（即极大化极小策略与极小化极大策略）这对策略告诉我们，局中人单方面背离平衡对中的平衡策略，比不背离所得到的期望支付要差。一般，总是如此，当你越靠近现实世界复杂情况时，你就越远离程式化和结构化的数学世界。单车道对策支付矩阵司机II 司机 I C D C (2,2) (3.4) D (4,3) (1,1) （1）没有支配策略（2）可见，极小极大原理不能作为混合动机对策中合理的行动步骤的基础（3）有两个平衡的策略性别之战对策支付矩阵妻子丈夫 C D C (2,2) (4,3) D (3,4) (1,1) 囚徒两难对策支付矩阵囚徒II 囚徒 I C D C (3,3) (1,4) D (4,1) (2,2) 其中支付P,R,S和T满足：（1）TRPS （2）R(T+S)/2 的实数一个引人入胜的心理学实验：（Robert Axelrod）想弄清3个问题：（1）在利己者群体中合作是怎样出现的？（2）采用合作策略的人会比不合作的对手生存得更好？（3）哪些合作策略会表现得更好，它们是如何达到支配地位的？ ????为此，他邀请了一些心理学家、数学家、政治学家和计算机专家共同来参加一个不同策略互相竞争的计算机竞赛。规则很宽松：（1）可利用先前对局中的任何信息；（2）程序不必是确定性的，即可是随机的方法。唯一要求是每一轮对局程序必须得到一个确定的决策：合作（C）或抗拒（D）。这样进行了200次对局，为光滑化由于非确定性策略带来的统计数字的波动，整个实验又进行了5次。结果证明最好的策略（即胜的策略）是最简单的策略。即称为针锋相对的策略“T For T”，只有三行程序，它由两条规则组成：（1）对第一个合作者采用合作的策略；（2）在以后的各轮对局中，执行你的对手在前一轮中采用的策略。经验表明：要让一个策略成功，它必须是好的又是宽容的。进一步实验又发现：针锋相对但非恶意的反击也是重要的策略，只是要求你的行动简单明了，正确无误，避免给人以太复杂的印象。 ? 对策论的必要前提是假设：局中人合理地行动，以一种本质上是无从区分是非的、自我服务的利己主义的方式作出决策。对策论至少解决了哲学中的困难问题之一：在合理和不合理行动之间的界限问题。数值分析家R.W.Hamming曾说：“对策论的目的在于深刻的见解，而不是解法。” ——《Five Golden Rules Great Theories of 20th-C