Text 6 博弈论.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Text 6 博弈论

Text 6 博弈论 博弈论是策略的科学。它试图从数学和逻辑的角度决定“游戏者”应该采取的行动,以确保在大量“游戏”中得到最好的结果。它研究的游戏从象棋到抚养小孩,从网球到接管公司。但这些游戏都有共同的特点,就是互相依存,也就是,每个参加者的结果取决于所有各方的选择(策略)。在所谓的零和游戏中,参与者的利益完全冲突,这样的话,一个人的所得总是另一个人的所失。更典型的游戏有可能要么双赢(正的和)要么双输(负的和),同时还有一些矛盾。 博弈论是由普林斯顿大学的数学家约翰. 冯.诺伊曼最先提出的。早年这项理论的重点在于纯粹冲突的游戏(零和游戏)。其他游戏被认为是合作的形式,也就是,参加者应该是共同选择和实施行动。最新的研究关注既非零和也非纯合作的游戏。在这些游戏中参与者分别选择自己的行动,但是他们和其他人的联系既有竞争也有合作的因素。 游戏基本上不同于中立环境下做出的决定。为了说明这点,想想伐木工人和将军所做决定的不同。当伐木工人决定好如何砍伐木头,他不期待木头会反击;他的环境是中立的。但是当将军想要减少敌军数量时,他必须要预计和克服对他计划的阻力。就像将军一样,参与游戏者必须意识到他和其他有智慧、有目的的人之间的互动。他自己的选择必须允许冲突和合作的可能性。 游戏的本质是参与者策略的互相依存。有两种不同的策略依存性:按次序的和同时的。对于前者,参与者按顺序移动,每个人都了解其他人前面的行为。对于后者,参与者同时行动,每个人都不知道其他人的行为。 在按次序移动的游戏中,对于参与者的一个总的原则是向前看和回过头来进行推理。每个参与者应该想到其他人将会如何对他现在的行为做出回应,接下来他又将如何应对,等等。参与者要预计到他最初的决定将最终引向何处,然后利用这个信息来计算他现在最好的选择。在考虑别人会如何应对时,参与者必须设身处地从别人的角度考虑,而不应该把自己的推理强加于人。 原则上,经过有限的一系列步骤后结束的任何按顺序进行的游戏都可以被完全“解决”。通过预测每个可能的结果我们决定每个参与者最好的策略。简单的游戏,比如三连棋,可以用这种方式解决,因此没有什么挑战性。对于很多其它游戏,比如象棋,计算太复杂,以至在实践中难以实施——即使用计算机。所以,参与者要预测几步,然后在经验的基础上努力评估后来的位置。 按顺序进行的游戏是线性链的推理,与之对照,同时行动的游戏涉及的是逻辑圈。尽管参加者同时行动,都不知道其他人现在的行为,但是每个人都必须了解还有其他的游戏参与者。而反过来,其他人也同样应该了解这点。这种思维方式应该是:“我想他知道我知道…”。 所以,打个比方,每个人应该把自己放在所有人的处境中,努力计算出结果,他自己最好的行为是这个整体计算不可缺少的一部分。 使用普林斯顿数学家约翰纳什提出的平衡概念可以解决这个逻辑圈的问题(循环推理该结束了)。我们寻找一系列的选项,每个参与者一个,让每个人的策略都最好,而所有其他人实行他们约定好的最佳策略。换句话,对于其他人的行为每个人都选择他最好的回应。 有时不管别人做什么,一个人最好的选项都是一样的,这被称为对那位参与者而言的支配性策略。 其它时候,一位参与者一直都有坏的选项——一项被支配的策略——也就是不管其他人做什么,别的选项对他而言总是会更好。寻找支配策略,消除被支配策略,这是寻求平衡的起点。 当我们说一个结果是一种平衡时,没有假设说每个人自己最好的选项会带给总体最佳的结果。其实,有臭名昭著的例子,比如囚徒困境,在这个困境中,参与者每个人追求最好的个人利益,却被带入一个坏的结果。 对于在同时行动的游戏中循环推理的问题, 纳什的平衡观念依然还是一个不完整的解决方案。有些游戏有很多这样的平衡,而其它游戏一个也没有,能够导致平衡的动态过程也未具体说明。但是尽管有这些缺陷,平衡的概念在分析许多策略互动时依然被证明是极其有用的。 下面的策略互动的例子说明了博弈论的一些基本原则: 囚徒的困境 两个嫌犯被分开讯问,每个人可以坦白或保持沉默,如果嫌犯A保持沉默,那么嫌犯B可以通过坦白得到更好的待遇。如果A坦白了,B最好坦白以避免遭受极其严厉的待遇。坦白是B的支配性策略,同样的道理也适用于A。所以,在平衡中双方都坦白。如果他们都保持沉默,双方的结果都会更好。这种合作的行为可以在重复的游戏中实现。因为合作的中断,从欺骗行为(坦白)带来的短暂收益会不及长期的损失,在这个背景下建议使用针锋相对的策略。 混合的行动 在一些冲突的环境下,任何系统的行为都会被对手发现和利用。所以,采取混合行动让对手猜是很重要的。典型的例子出现在体育运动中——不管是在足球比赛中特定情景下的跑动或传球,还是在网球中击斜线球或触线球。博弈论量化了这个想法并且具体列出了这些混合行动的正确比例。 策略性的动作 一位参与者可以使用威胁或承诺的手段以

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档