博弈理.pptVIP

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈理

第三章 博弈理论 第一节 基本概念 一、组成要素: 局中人(players):指做决策的个体。每个局中人的目标都是通过选择行动来使自己的效用最大化。 信息(information)指局中人在博弈中的知识,特别是有关其他局中人(竞争者或对手)的特征和行动的知识。 策略(strategies)是局中人选择行动的规则,它告诉局中人在什么时候选择什么行动。 ; 支付(payoff):指每个参与人从博弈中获得的效用水平。 均衡(equilibrium):指所有局中人的最优战略组合或行动组合。或者,均衡s*=(s1*,…, sn*)指由博弈中的n个局中人每人选取的最佳战略所组成的一个战略组合。 ;二、划分类型 1. 行动顺序 静态博弈(static game):博弈中局中人同时选择行动,或虽然不是同时行动但后行动者并不了解前行动者采取了什么具体行动。 动态博弈(dynamic game):指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 2. 信息结构 完全信息博弈(complete information):指局中人完全了解其他局中人的特征、战略空间及支付函数。 不完全信息博弈(incomplete information):指至少有一个局中人不完全了解其他局中人的收益或收益函数。 ;3. 合作博弈与非合作博弈 合作博弈(cooperative game):是以局中人整体的可能联合行动集合为基本要素。通俗地说,如果局中人能够达成有约束力的协议或合约,则该博弈称为合作博弈。合作博弈强调的是集体理性。 非合作博弈(non-cooperative game):是以单个局中人的可能行动集合为基本要素的博弈。通俗地说,如果局中人不能在博弈中达成有约束力的协议或合约,则称该博弈为非合作博弈。非合作博弈强调的是个体理性。 ;4. 零和博弈与非零和博弈 按照博弈的收益分配结果划分,博弈可以划分为零和博弈和非零和博弈。 零和博弈指在博弈中一组局中人所得到的支付(或收益)恰好是另一组局中人的损失。通俗地说,博弈结果总和为零的博弈称为零和博弈。 非零和博弈指所有局中人的支付(或收益)的代数和不为零。为正或为负。 ; ;三、支付矩阵表示方法 双因素表示法:指在两个局中人的博弈中,每一单元格都有两个数字——分别表示两个局中人的收益。 局中人B 左 右 上 2, 1 0, 0 局中人A 下 0, 0 1, 2 ;第二节 纳什均衡 一、含义: Nash均衡是指由全部局中人的最优战略组成的均衡。在其他局中人战略既定的情况下,没有任何单个局中人会选择其他战略,从而没有任何局中人会打破这种均衡。 Nash 均衡是一个稳定状态的解。在这个(“僵局”)状态下,每个局中人的决策依赖于均衡的知识。 二、求解:; d1 d2 d3; d1 d2 d3 min;;三、优超原理;;一、囚徒困境——自愿坐牢的嫌疑人 两个嫌疑犯作案后被警察抓住,被分别关在不同的房间里受审讯。警察知道两个人有罪,但缺乏足够的证据定罪,除非两个人当中至少有一个人坦白。 警察告诉每个人: 1、如果两个人都坦白,各判刑5年; 2、如果两个人都不承认,每人判刑1年; 3、两个人一人坦白一人抵赖,坦白者释放,抵赖者判刑8年;;这样,每个嫌疑犯面临4种可能后果: 释放(自己坦白同伙抵赖); 判刑1年(两人都抵赖); 判刑5年(两人都坦白); 判刑8年(自己抵赖同伙坦白)。 ;对A而言: 如B坦白,A坦白时的支付为-5,抵赖时的支付为-8,因而坦白好; 如B抵赖,A坦白时的支付为0,抵赖时的支付为-1,还是坦白好; 这样,坦白是A的唯一最优策略。同样也是B的唯一最优策略。 此博弈的纳什均衡是(坦白,坦白)。 ; 应用1:军备竞赛 20多年前,美、苏两国是两个超

文档评论(0)

ybcm963 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档