- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;博弈:国家之间、企业之间、人与人之间
生活中的博弈:
——打牌、下棋
——宿舍打扫卫生
——宿舍买电风扇
——家庭装修
——挤公共汽车
;二、产生与发展
通常,人们将数学家冯?诺依曼(vonNeumann)于1928年提出的二人零和博弈的极小化极大定理作为博弈论奠基的标志。
1944年,数学家冯?诺依曼(vonNeumann)和经济学家摩根斯坦恩(Morgenstern)合作发表了《博弈论和经济行为》一书,被认为是应用博弈论进行经济分析的开始。
;50年代合作博弈发展到鼎盛期:纳什和夏普里提出“讨价还价”模型;吉利斯和夏普里提出“核”的概念。
50年代非合作博弈开始创立:1950和1951年,纳什发表了两篇关于非合作博弈的重要论文《n人博弈中的均衡点》、《非合作博弈》。1950年,塔克定义了“囚徒困境”(prisoners’dilemma)。
;60年代,泽尔腾将纳什均衡的概念引入了动态分析,提出“精炼纳什均衡”概念。1967-1968年,海萨尼将不完全信息引入博弈论的研究。此后,他们两人长期合作,发展了非合作博弈理论。
80年代,克瑞普斯和威尔逊于1982年合作发表了关于动态不完全信息博弈的重要文章。;1994年诺贝尔经济学奖获得者:
;3.合作博弈与非合作博弈
合作博弈(cooperativegame):是以局中人整体的可能联合行动集合为基本要素。通俗地说,如果局中人能够达成有约束力的协议或合约,则该博弈称为合作博弈。合作博弈强调的是集体理性。
非合作博弈(non-cooperativegame):是以单个局中人的可能行动集合为基本要素的博弈。通俗地说,如果局中人不能在博弈中达成有约束力的协议或合约,则称该博弈为非合作博弈。非合作博弈强调的是个体理性。
;4.零和博弈与非零和博弈
按照博弈的收益分配结果划分,博弈可以划分为零和博弈和非零和博弈。
零和博弈指在博弈中一组局中人所得到的支付(或收益)恰好是另一组局中人的损失。通俗地说,博弈结果总和为零的博弈称为零和博弈。
非零和博弈指所有局中人的支付(或收益)的代数和不为零。为正或为负。
;
;三、支付矩阵表示方法
双因素表示法:指在???个局中人的博弈中,每一单元格都有两个数字——分别表示两个局中人的收益。
局中人B
左右
上2,10,0
局中人A
下0,01,2
;;一、囚徒困境——自愿坐牢的嫌疑人
两个嫌疑犯作案后被警察抓住,被分别关在不同的房间里受审讯。警察知道两个人有罪,但缺乏足够的证据定罪,除非两个人当中至少有一个人坦白。
警察告诉每个人:
1、如果两个人都坦白,各判刑5年;
2、如果两个人都不承认,每人判刑1年;
3、两个人一人坦白一人抵赖,坦白者释放,抵赖者判刑8年;;这样,每个嫌疑犯面临4种可能后果:
释放(自己坦白同伙抵赖);
判刑1年(两人都抵赖);
判刑5年(两人都坦白);
判刑8年(自己抵赖同伙坦白)。
;对A而言:
如B坦白,A坦白时的支付为-5,抵赖时的支付为-8,因而坦白好;
如B抵赖,A坦白时的支付为0,抵赖时的支付为-1,还是坦白好;
这样,坦白是A的唯一最优策略。同样也是B的唯一最优策略。
此博弈的纳什均衡是(坦白,坦白)。
;
应用1:军备竞赛
20多年前,美、苏两国是两个超级大国,他们相互对垒都竞相增加各自的军费预算。假设他们有两种策略选择:扩军或裁军。双方选择的支付如下:
苏联
扩军裁军
扩军-2000,-20008000,-∞
美国
文档评论(0)