- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论初步概要1
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞; 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们在博弈论领域作出的贡献。 博弈论的基本概念 (一)博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。 一些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。 (二)博弈的组成要素 一个博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、均衡等。 1、参与人指的是博弈中选择行动以自己效用最大化的决策主体(可以是个人,也可以是团体); 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排; 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识; 5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西; 6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则来决定均衡。 (三)博弈的分类 根据参与人的多少,可将博弈分为单人博弈、两人博弈或多人博弈; 走迷宫、选择运输线/囚徒困境、猜硬币、齐威王田忌赛马/申办奥运会 根据参与人是否合作,可将博弈分为合作博弈或非合作博弈;古诺/价格领导 根据博弈结果的不同,又可分为零和博弈、常和博弈与变和博弈。 —猜硬币,田忌赛马,石头-剪刀-布 —分配固定数额的奖金、利润,遗产官司 —囚徒困境、产量博弈 从参与人对其他参与人的各种特征信息的获得差异来分,博弈可分为完全信息博弈和不完全信息博弈。 完全信息指的是每一个参与人对所有其他参与人的特征,如策略集合及得益函数都有准确完备的知识;否则就是不完全信息。 四种不同类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。 著名的“囚徒困境”的例子 警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;如果两人都坦白认罪,则他们将被各判5年监禁。问:两个罪犯会如何选择(即是坦白还是抵赖)? (四)纳什均衡 1、占优策略均衡。一般来说,由于每个参与人的得益是博弈中所有参与人的策略的函数,因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中,一个参与人的最优策略可能可以不依赖于其他参与人的策略选择,就是说,不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为“占优策略”。 如果一个博弈中,某个参与人有占优策略,那么该参与人的其他可选择策略就被称为“劣策略”。 在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。 这给我们一个启示,我们学习博弈论,也许更应该研究的是怎样设计一种制度,在满足个人理 性的同时,去争取达到“集体理性”。 (2)囚犯困境模型的扩展应用:寡头厂商合作的不稳定性 卡特尔 2.纳什均衡 指一组给定对手行为前提下对各博弈方存在的最佳选择;在纳什均衡状态下,只要其它参与者不变换策略选择,任何单个参与者不可能单方面通过变换策略来提高他的所获支付。 几个博弈案例 1.智猪博弈(占优战略均衡) 2.交通博弈;斗鸡博弈,告白博弈 3. 田忌赛马 4.
文档评论(0)