- 1、本文档共72页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第节 博弈论与决策管理
博弈论与决策 招还是不招?这是个问题 斯大林时代的苏联,一个乐队指挥坐火车时看乐谱,两个克格勃军官以为是密码,就将他抓了起来,他说那是柴可夫斯基的乐谱,但无无济于事。 第二天,克格勃告诉他,已把他的同伙柴可夫斯基也抓起来了,正在招供。 他们俩面临一种艰难的选择:如一方招供另一方不招,坦白者从宽判1年,抗拒者从严判25年;如果双方都招供,则各以间谍罪判10年;如双方均不招供,克格勃无法定罪,各自坐牢3年。 他们分别关押,请问应该招、还是不招? 可能的思想斗争: 坦白的原因 1、可能会被判的很轻 2、最坏的结果-10,-1,比-25,-3要好 抵赖的原因 1、我没犯罪,不愿意招 2、双方抵赖各-3,比双方坦白各-10好 3、人云:坦白从宽 牢底坐穿,抗拒从严回家过年 1、博弈论简介 博弈论(Game Theory)又名对策论,游戏论 失火了,屋里人很多,你往哪个门跑—这就是博弈 你的行动结果不仅取决于你的策略选择,同时也取决于他人的策略选择。 它研究个体或组织之间存在利益冲突情况下如何进行最优决策。 1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)获诺贝尔经济学奖。 2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为该年度的诺贝尔经济学奖得主。 2005年诺贝尔经济学奖授予罗伯特·奥曼和托马斯·谢林,以表彰他们“运用博弈论的分析方法对现实的政治、经济问题进行分析,改变了我们对冲突与合作的理解”。 博弈的分类 一、静态博弈与动态博弈 参与者行动的先后顺序,静态博弈是同时作出决策(不了解对手的决策方案),动态博弈是参与者先后作出决策(后行动的人知道先行动者的行动方案)。 二、完全信息博弈与不完全信息博弈 对其他参与者收益支付信息的掌握程度。 不完全信息博弈中至少有一人不能确切了解其它决策者收益函数。 三、合作博弈与非合作博弈 能否达成一个有约束力的协议,合作博弈强调集体理性。(经济学主要讨论非合作博弈) 四、一次性博弈与重复博弈 博弈重复多次进行。(注意区分动态博弈) 囚徒困境(完全信息下的静态博弈) “囚徒的困境(Prisoners’ Dilemma)”,从博弈论角度看,这是一个存在占优均衡的博弈:因为对囚犯A,B来说,无论对方如何选择,“坦白”都是各自的最优选择。 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而,由于猜忌,试图获得更大好处等竞争性动机阻碍了它们达到更好的互利选择,我们将看到,寡头垄断厂商经常面临类似的困境。 启示:个体理性决策常导致集体非理性结果 “囚徒的困境”还对亚当·斯密的“看不见的手”的原理提出挑战。 这位经济学圣人在《国富论》中的名言:“每个人都力图利用好他的资本,使其能实现最大的价值。一般说来,他并不企图增进公共福利,他所追求的仅仅是他个人的利益。但在他这样做的时候,有一只看不见的手引导着他去实现另一种目标,这种目标并非是他本意所要追求的东西。通过追逐个人利益,他经常增进社会利益。” 按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。 从某种意义上说,纳什提出的非合作博弈的囚徒悖论实际上动摇了西方经济学的基石。 斗鸡博弈 假设两只公鸡遇到一起,每只公鸡都有两个行动选择:进攻或后退。 后退是很丢面子的事情,若鸡甲进攻,乙后退,则甲赢。双方前进,两败俱伤。 3、博弈论中的均衡 例: 两个寡头进行价格战博弈的收益矩阵。 博弈论中的均衡是一组稳定的博弈结果。双方均不愿先改变策略。博弈的均衡是稳定的,因而是可以预测的。 纳什均衡 纳什均衡(非合作性均衡): 纳什均衡是这样一组策略,它使所有博弈参与者都不能再提高其收益的状况。此时,双方在对方给定的策略下均不愿意调整自己的策略。 下例中,A有占优策略即正常价格策略,而厂商B没有占优策略,它必须根据A的占优策略来确定其战略选择,即其选择受A的选择的影响。 占优均衡与纳什均衡的区别 4、最大最小策略 迄今为止,对厂商行为的分析都建立在利润最大化基础上。但在一些竞争激烈的寡头垄断市场,冯·诺依曼和摩根斯坦认为决策者也可能采取一种风险厌恶策略,即确保在最坏的结果中得到最好的结果。 这种决策规则称最大最小策略(Maximin Strategy):博弈者在可能最少的利润方案中选择利润最大的方案。 风险与均衡 由于纳什均衡要求理性共识和一致预期,当人们可能犯小小的错误时,纳什均衡不一定被选择。如下面
文档评论(0)