不完全信息博弈和贝叶斯均衡课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用ti表示参与人i的一个特定的类型,Ti表示参与人i所有类型的集合(亦称类型空间,type space),即 ,t=(t1,…,tn)表示所有参与人的类型组合, t-i=(t1,…,ti-1,…,tn)表示除参与人i之外其他参与人的类型组合。所以,t=(ti, t-i)。 用 表示参与人i在知道自己类型为ti的情况下,关于其他参与人类型的推断(即条件概率),则 2) 参与人关于“自然”选择的推断: 用p(t1,…,tn)表示定义在参与人类型组合上的一个联合分布概率函数。 假设pss=0.2,psw=0.3,pws=0.25,pww=0.25。 其中, pss:决斗者1和决斗者2同时强硬的概率; psw:决斗者1强硬、决斗者2软弱的概率; pws:决斗者1软弱、决斗者2强硬的概率; pww:决斗者1软弱、决斗者2软弱的概率; 虽然决斗者1不知道决斗者2 的类型,但由于决斗者1知道自己的类型,因此他可以根据贝叶斯公式推知决斗者2的类型分布。 例如 根据贝叶斯规则,“强硬”的决斗者1可以推知: 决斗者2是“强硬”的概率为 决斗者2是“软弱”的概率为 “软弱”的决斗者1可以推知: 决斗者2是“强硬”的概率为 决斗者2是“软弱”的概率为 不完全信息博弈:完全信息博弈在不完全信息上的拓展,我们又将其称为贝叶斯博弈; 贝叶斯博弈:静态贝叶斯博弈和动态贝叶斯博弈; 三、贝叶斯博弈的战略式描述 贝叶斯博弈的定义 贝叶斯博弈包含以下五个要素: 参与人集合 ; 参与人的类型集合T1,…,T2; 参与人关于其他参与人类型的推断 …, ; (4) 参与人类型相依的行动集A(t1),…, A(tn); (5) 参与人类型相依的支付函数 ,…, 。 贝叶斯博弈中的战略 在贝叶斯博弈 中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti); 它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。 用 表示给定其他参与人的战略 ,类型为ti的参与人i选择行动ai时的期望效用,则 其中,对 , 为给定t-i时由s-i所确定的其他参与人的行动组合 贝叶斯博弈的时间顺序如下: “自然”选择参与人的类型组合t=(t1,…,tn),其中,参与人i观测到“自然”关于自己类型ti的选择;虽然参与人i观测不到“自然”关于其他参与人类型t-i的选择,但参与人i具有关于其他参与人类型的推断 ; 参与人同时选择行动,每个参与人i从行动集Ai(ti)中选择行动ai(ti) ; 参与人i得到 。 “斗鸡博弈”的贝叶斯模型 参与人为决斗者1和2; 用s表示决斗者是“强硬”的,w表示决斗者是“软弱”的,所以T1=T2={s,w}。 用pxy表示“自然”选择类型组合(x,y)的概率,并假设pxy为共同知识,则决斗者1关于其对手类型的推断为p1(y|x)。 决斗者1关于类型相依的行动空间A1(x)={U,D},决斗者2关于类型相依的行动空间A2(y)={U,D}。 每位决斗者i的支付由前面的图决定。 在贝叶斯博弈中,对于一个理性的参与人i,当他只知道自己的类型ti而不知道其他参与人的类型时,给定其他参与人的战略s-i ,他将选择使自己期望效用(支付)最大化的行动 ,其中 四、贝叶斯纳什均衡 纯战略贝叶斯Nash均衡 贝叶斯博弈 的纯战略贝叶斯Nash均衡是一个类型相依的行动组合 ,其中每个参与人在给定自己的类型ti和其他参与人的类型相依行动 的情况下最大化自己的期望效用。 也就是,行动组合

文档评论(0)

132****5705 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5104323331000004

1亿VIP精品文档

相关文档