不完全信息博弈和贝叶斯均衡.pptVIP

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
不完全信息博弈和贝叶斯均衡

例如 根据贝叶斯规则,“强硬”的决斗者1可以推知: 决斗者2是“强硬”的概率为 决斗者2是“软弱”的概率为 “软弱”的决斗者1可以推知: 决斗者2是“强硬”的概率为 决斗者2是“软弱”的概率为 不完全信息博弈:完全信息博弈在不完全信息上的拓展,我们又将其称为贝叶斯博弈; 贝叶斯博弈:静态贝叶斯博弈和动态贝叶斯博弈; 三、贝叶斯博弈的战略式描述 贝叶斯博弈的定义 贝叶斯博弈包含以下五个要素: 参与人集合 ; 参与人的类型集合T1,…,T2; 参与人关于其他参与人类型的推断 …, ; (4) 参与人类型相依的行动集A(t1),…, A(tn); (5) 参与人类型相依的支付函数 ,…, 。 贝叶斯博弈中的战略 在贝叶斯博弈 中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti); 它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。 用 表示给定其他参与人的战略 ,类型为ti的参与人i选择行动ai时的期望效用,则 其中,对 , 为给定t-i时由s-i所确定的其他参与人的行动组合 贝叶斯博弈的时间顺序如下: “自然”选择参与人的类型组合t=(t1,…,tn),其中,参与人i观测到“自然”关于自己类型ti的选择;虽然参与人i观测不到“自然”关于其他参与人类型t-i的选择,但参与人i具有关于其他参与人类型的推断 ; 参与人同时选择行动,每个参与人i从行动集Ai(ti)中选择行动ai(ti) ; 参与人i得到 。 “斗鸡博弈”的贝叶斯模型 参与人为决斗者1和2; 用s表示决斗者是“强硬”的,w表示决斗者是“软弱”的,所以T1=T2={s,w}。 用pxy表示“自然”选择类型组合(x,y)的概率,并假设pxy为共同知识,则决斗者1关于其对手类型的推断为p1(y|x)。 决斗者1类型相依的行动空间A1(x)={U,D},决斗者2类型相依的行动空间A2(y)={U,D}。 每位决斗者i的支付由前面的图决定。 在贝叶斯博弈中,对于一个理性的参与人i,当他只知道自己的类型ti而不知道其他参与人的类型时,给定其他参与人的战略s-i ,他将选择使自己期望效用(支付)最大化的行动 ,其中 四、贝叶斯纳什均衡 纯战略贝叶斯Nash均衡 贝叶斯博弈 的纯战略贝叶斯Nash均衡是一个类型相依的行动组合 ,其中每个参与人在给定自己的类型ti和其他参与人类型相依的行动 的情况下,最大化其期望效用。 也就是,行动组合 是一个纯战略贝叶斯Nash均衡,如果对 , 贝叶斯博弈纳什均衡的存在性 定理 一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡。 类型?1 类型?2 左 右 左 右 3,1 2,0 3,0 2,1 0,1 4,0 0,0 4,1 上 下 甲 乙 静态贝叶斯博弈均衡举例: 表中甲、乙同时行动,甲只有一种类型,但乙有两种类型:?2={?1,?2};甲不了解对方是哪一种类型,但他相信对方为?1、?2的概率各为1/2。求解均衡。 乙:如果为?1,有占优战略为“左”;如果为?2,有占优战略为“右” 甲:由于甲相信对方为两种类型的可能性各为1/2,故甲考虑选“上”和“下”分别给他带来的期望收益; 结果选“上”,期望支付为5/2,选“下”,期望支付为2,因而甲的最优选择是“上”。 纳什均衡为s1*=上;s2*(?1)=左,s2*(?2)=右。 贝叶斯Nash均衡的求解: 简化的“斗鸡博弈”: 强硬 软弱 U D

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档