- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章 博弈论; 博弈论用来分析所观察到的决策主体相互影响时的现象,在给定的条件下寻求最优的解决办法。本章主要介绍非合作博弈,非合作博弈可分成四种情况:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。本章分析的重点在完全信息静态博弈和完全信息动态博弈,分别给出纳什均衡和子博弈精炼纳什均衡的详细讲解。;第一节 博弈论概述;⒈博弈论的发展
1944年,由冯?诺依曼和摩根斯坦恩合著的《博弈论和经济行为》一书的出版标志着现代博弈论作为一种系统理论的创立。
20世纪50年代,纳什创立了公理化的讨价还价理论,证明纳什讨价还价解的存在性,逐渐形成了以纳什非合作博弈理论为核心的现代博弈论体系。20世纪60年代以后,泽尔滕在纳什的研究基础上引入动态分析,海萨尼则把不完全信息引入到博弈论中。
20世纪70年代以后,经济学家开始强调个人理性。;⒉博弈论与主流经济学
博弈论进入主流经济学,反映了经济学发展的以下几个趋势:①经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定;②经济学越来越转向人与人之间竞争与合作的研究,特别是经济学注意到理性人的个人理性行为可能导致的集体非理性;③经济学越来越重视对信息的研究。
博弈可以划分为合作博弈和非合作博弈。合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议。如果能,就是合作博弈;反之,则是非合作博弈。;二、博弈分析举例;⒉掷币游戏
A、B两个小孩玩掷币游戏,两人各拿出一枚硬币抛掷在地面上,要么正面朝上,要么反面朝上。
①都同为正面或反面朝上,A赢得B一枚硬币;
②一正面一反面朝上,A输给B一枚硬币。
这个例子中,两个小孩各自得到的结果(赢得一枚硬币或者输掉一枚硬币),不仅取决于自己掷币的后果,也取决于对手掷币的后果,双方决策的互相影响构成博弈。
在这个博弈中,一方所得正是其他方所失,这种博弈称为零和博弈。;⒊囚徒困境
囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。表10-1给出了囚徒困境模型的表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。;三、博弈的要素; ③信息是参与人在博弈??的知识,特别是有关其他参与人(对手)的特征和行动的知识。在囚徒困境模型中,两囚徒的信息是都知道自己和另一囚徒在选择坦白和抵赖的不同组合时面对的处罚。
④策略:是参与人在拥有既定信息情况下的行动规则,它规定参与人在什么时候选择什么行动。一个参与人的所有可选择的策略的集合就是这个参与人的策略空间。如果每个参与人选择一个策略,就构成一个策略组合。
⑤支付:在博弈论中指一个特定策略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用;水平。支付是博弈参与人真正关心的东西。在一个策略组合下,所有参与者的支付就构成了一个支付组合。在囚徒困境模型中,如果两囚徒的策略组合为(抵赖,坦白),那么囚徒A的支付为-10,囚徒B的支付为0,两囚徒的支付组合为(-10,0);如果两囚徒的策略组合为(坦白,坦白),那么囚徒A和囚徒B的???付均为-8,两囚徒的支付组合为(-8,-8)。
⑥结果:是博弈分析者感兴趣的所有东西,如均衡策略组合、均衡支付组合等。
⑦均衡:是所有参与人的最优策略的组合。;四、博弈的分类;第二节 完全信息静态博弈; 博弈可以采用两种不同的方式来表述,一种是策略式表述,一种是扩展式表述。从理论上讲,这两种表述形式几乎是完全等价的,但策略式表述更适合于分析静态博弈,扩展式表述更适合于分析动态博弈。;;表10-3 掷币游戏;表10-4 斗鸡博弈;二、纳什均衡;⒉重复剔除的占优均衡
考虑“智猪博弈”例子。猪圈里围着两头猪,一头大猪,一头小猪。猪圈的一头有一个猪槽,另一头安装了一个按钮,控制着猪食的供应。按下一按钮会有8个单位的猪食进槽,但按下按钮的猪需要付出2个单位的成本。若大猪先到,大猪吃到7个单位,小猪只能吃1个单位;若同时到,大猪吃5个单位,小猪吃3个单位;若小猪先到,大猪和小猪各吃4个单位。表10-5的Ⅰ表列出对应不同策略组合的支付水平,如第一格表示两头猪同时按下按钮,就会同时走到猪食槽,大猪吃5个单位,小猪吃3个,扣除2个单位的成本,支付水平分别为3和1。;表10-5 智猪博弈与重复剔除的占优均衡;⒊纳什均衡
如果重复剔除劣策略后剩下的策略组合是唯一的,那么该博弈才是重复剔除占优可解的。但很多博弈是无法使用重复剔除劣策略的方法找到均衡解的。例如性别之战的例子。一男一女谈恋爱,周末安排业余活动,要么看足球; 一个参与人的纳什均衡策略是面对其他参与人的均衡策略时的最优选择。在囚徒困境中,(坦白,坦白)是
文档评论(0)