博弈论不完全信息静态博弈.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
不完全信息静态博弈;——摘自《庄子》;不完全信息;不完全信息;一个简例:市场进入博弈;一个简例:市场进入博弈;一个简例:市场进入博弈;一个简例:市场进入博弈;一个简例:市场进入博弈;一个简例:市场进入博弈;一个简例:市场进入博弈;在前面市场进入博弈中,进入者似乎是在与两个不同的在位者博弈,一个是高成本的在位者,一个是低成本的在位者。 一般地,如果在位者有T种可能的不同成本函数,进入者似乎是在与T个不同在位者博弈。;如果一个参与人并不知道他在与谁进行??弈,博弈的规则无法进行定义。 海萨尼通过引入虚拟的参与人——”自然”(Nature),将不完全信息博弈转换为完全但不完美信息的博弈,从而可用完全信息博弈论进行处理,这就是著名的“海萨尼转换”(Harsanyi Transformation);图4.1就是市场进入博弈问题,经过海萨尼转换后,得到的博弈树。;不完全信息静态博弈中,参与人i的行动空间Ai可能依赖于他的类型θi,或者说行动空间是类型依存的(type-contingent)。 比如,一个企业选择什么价格依赖于其实力;一个人能干什么事情依赖于其能力,等等。;因此,行动空间可以表示为Ai(θi),一个特定行动可表示为集合Ai(θi)中的一个元素 。 类似的,参与人i的支付函数也是类型依存的(比如不同成本函数的企业利润各不相同。),用ui(ai, a-i; θi)表示参与人i的效用函数。于是可以用上述参数表示一个静态贝叶斯博弈。;更为一般地,自然在博弈的开始选择还可包括参与人的战略空间、信息集、支付函数等。;我们将一个参与人所拥有的所有个人信息称为他的类型(Types) 不完全信息意味着,至少有一个参与人有多个类型(否则就成为完全信息博弈)。;一般地,用θi表示参与人i的一个特定类型,Θi表示参与人i的所有类型的集合,即θi∈ Θi 假定,只有参与人i知道自己的类型θi ;根据海萨尼公理(Harsanyi Doctrine),假定各参与人类型的分布函数P(θ1, …, θn )是共同知识。 以市场进入博弈为例,在位者高成本的概率p是共同知识意味着:进入者知道在位者是高成本的概率为p,在位者知道进入者认为在位者是高成本的概率是p…;用θ-i=(θ1,…, θi-1, θi+1, …, θn )表示除了i之外的所有参与人的类型组合。θ=(θi, θ-i )表示所有参与人的类型组合。 根据条件概率规则;N人静态贝叶斯博弈的战略式表述包括:参与人的类型空间Θi,条件概率p1,…,pn,类型依存战略空间为Ai(θi), 类型依存支付函数ui(ai,a-i; θi), i=1,…,n。参与人i知道自己的类型θi(属于Θi),条件概率pi=pi(θ-i| θi)描述给定自己属于θi的情况下,参与人i关于其他参与人类型的一个估计。可以用G={Ai; θi;pi; ui; i=1,…,n}表示这个博弈。;给定参与人i只知道自己的类型θi,而不知道其他参与人的类型θ-i,参与人i将选择ai(θi)以最大化自己的期望效用。参与人i的期望效用函数定义为 ;参与人的类型空间Θi,条件概率p1,…,pn,类型依存战略空间为Ai(θi), 类型依存支付函数ui(ai,a-i; θi), i=1,…,n。 参与人i知道自己的类型θi(属于Θi),条件概率pi=pi(θ-i| θi)描述给定自己属于θi的情况下,参与人i关于其他参与人类型的一个估计。可以用G={Ai; θi;pi; ui; i=1,…,n}表示这个博弈。;N人静态贝叶斯博弈的战略式表述;贝叶斯纳什均衡(Bayesian Nash Equilibrium);贝叶斯纳什均衡(Bayesian Nash Equilibrium);类似地,可以定义混合策略贝叶斯纳什均衡。此处从略。 均衡的存在形式纳什均衡存在性定理的推广,此处从略。 通过海莎尼转换,不完全信息静态博弈就转化成完全但不完美信息博弈 ;在不完全信息古诺模型中,参与人的类型是成本函数。 假定市场出清价格为P=a-q1-q2,每个企业都有不变的单位成本。令ci为企业i的单位成本,那么,企业i的利润为 Zi=qi(a-q1-q2-ci),i =1,2 ;假定企业1的单位成本c1是共同知识,企业2的单位成本可能是C2L也可能是C2H。 C2L C2H;企业2知道自己的成本是C2L还是C2H,但企业1只知道企业2的成本概率为(p, 1-p); 为更具体进行分析,可假设a=2, c1=1, C2L=3/4, C2H=5/4, p=1/2,并记;给定企业2知道企业1的成本,企业2将选择q2,实现利润(记为Z2 )的最大化。记a - c2 = t.由Z2=q2 (t - q1* - q2),可以求出 q2*(q1;t)=(1/2)(t-q1) 上式表明,企

文档评论(0)

3471161553 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档