第八章 博弈论初步.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 博弈论初步

第八章 博弈论初步 目前博弈论发展的非常深入,这里只是介绍一些初步知识。在四、五十年代,由冯·诺依曼(Von Neumann)、摩根斯坦恩(Morgenstern)把对策论、运筹学引入经济学,形成了最早的博弈论。几十年来,博弈论在经济学中发挥着越来越大的重要作用,1994年的诺贝尔经济学奖就授予三位博弈论学家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi)。博弈论的英文是GAME THEORY,字面的意思是游戏策略,及用类似游戏中解决问题的方法,揭示解决社会、经济及其他领域问题的策略、对策,因此有的还把博弈论译成对策论。准确的说博弈论是在给定的条件下寻求最优策略,这里给定的条件包含其他人的策略以及本人的决策对其他决策主体的影响。策略性活动在社会、经济、政治生活中大量存在,也可以说,整个社会、经济、政治生活都是博弈行为。 因此,博弈论作为一种方法,广泛的应用在经济、政治、军事、外交中,只是博弈论在经济学中应用的最广泛、最成功。 如古诺均衡、STACKELBERG均衡、CHAMBERLIN 均衡、BERTRAND 均衡、HOTELLING 均衡,都属于经济学中的博弈过程。 第一节 基本概念 一、博弈论 1.定义:博弈论是描述、分析多人决策行为的一种决策理论,是多个经济主体在相互影响下的多元决策,决策的均衡结果取决于双方或多方的决策。如下棋,最后的结果就是由下棋双方你来我往轮流做出决策,决策又相互影响、相互作用而得出的结果。 2.博弈论与优化理论的异同点   1)相同点:博弈论与优化理论都是在给定的条件下,寻求最优决策的过程; 2)不同点: 优化理论可以看成是单人决策,而博弈理论可以看成是多人决策。 在优先理论的决策过程中,影响结果的所有变量都控制在决策者自己手里;而在博弈论的决策过程中,影响结果的变量是由多个决策者操纵的。如企业在追求成本最小化、产量最大化、利润最大化的过程中总是假定外部条件给定,这实际上表明是一个优化问题,因为除了给定的外部条件外,剩下的因素都有决策者来控制,从而决策者自己就能控制决策的结果;如果外部条件不是给定的,而是有其他主体参与的过程,这时的决策过程就变成了一个博弈过程了,因为决策的最终结果不但取决于决策者本身,而且也取决于其他决策者的决策。 优化过程是一个确定的过程,而博弈过程是确定性和不确定性的统一。 优化过程是一个确定的过程,因为做出决策后,确定的结果就出来了。说博弈过程有确定性,是因为决策各方的决策做出后,每一方的收益就确定了;说博弈过程有不确定性,在于一方做出决策后,影响结果的变量还有众多的其他决策者,在不知道其他主体行为的情况下,结果就不确定。例如:在一次具体的战斗中,一方是否发起进攻,是一个决策。如果发起进攻,对方肯定有所反应,客观上讲,必然会有一个确定的结果存在,这是确定性的表现。但是最后的结果如何,取决于对方如何应对, 所以在发起进攻时,并不能知道结局是怎样的,这就是不确定性的表现。如果一方发起进攻后,另一方马上投降,则战斗结束;如果对方进行反攻,从理论上来讲,结果取决于双方实力以及双方收益的大小。由此可以看出博弈的广泛存在, 在现实生活中做出任何决策时,实际上都受到其他主体决策的影响并对我们做决策产生一定影响,决策的结果除了由我们自己决定外还要受到其他决策主体的影响,这实际上就是一个博弈过程。 二、参与者(PLAYER) 参与博弈的利益主体叫做参与者。英文原意为玩主,也有译成局中人的。在二人博弈中,有两个参与者;在三人博弈中,有三个参与者;在多人博弈中,有多个参与者。 三、策略和策略空间: 1.策略: 在给定条件博弈中,参与者完整的一套行动计划叫做策略。例如我国古代著名的谋略故事“田忌赛马”中,国王的赛马计划是:先出上等马,再出中等马,最后出下等马;田忌的赛马计划是:先出下等马,再出上等马,最后出中等马。这里的赛马计划就是一套完整的行动计划,也就是一个策略。 2.策略空间: 参与者可以选择的策略的全体就组成了策略空间。例如在“田忌赛马”中,共有六种行动方案可供选择:上中下(先出上等马,再出中等马,最后出下等马)、上下中、中上下、中下上、下上中、下中上。决策时田忌可以选择其中任何一个策略,在故事中,因为国王固定选择了上中下,所以田忌选择了下上中,从而赢得了比赛。任何一人策略的改变都将使结果也随之改变,比如国王选择了中下上,而田忌选择了下上中,则国王将赢得比赛。 四、报酬函数与报酬矩阵: 1.报酬函数: 每一个参与博弈的参与者,他的收益依附于各个参与者所出的策略,这种收益与策略的依附关系就构成了报酬函数。也就是说,第i个参与者的收益取决于所有参与者的策略,而不仅仅是自己的策略,表示成数学式子就

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档