- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论及其经济学应用01
证明:1.冷酷战略是纳什均衡。 由于是无限次博弈,不能用逆推归纳法求解。令δ为二者相同的贴现因子。假定囚徒j选择上述冷酷战略,冷酷战略是否是i的最优战略呢?如果i在某阶段选择坦白,该阶段收益为0不是-1,但这将触发j的“永远坦白”的惩罚,因此i随后每个阶段的收益均为-8。 如果0+δ(-8)+δ2(-8)+…≤-1+δ(-1)+δ2(-1)+… 或δ*≥1/8。i将不会选择坦白。就是讲,在δ≥1/8时,给定j坚持冷酷战略,并且j没有首先坦白,i不会选择首先坦白。 若j首先选择了坦白,由于j坚持冷酷战略,j以后永远选择坦白,这时i坚持冷酷战略每阶段收益为-8,否则为-10,即i有积极性坚持冷酷战略。 由于对称性知,给定i选择冷酷战略,j也有积极性坚持冷酷战略。 上述证明了这是一个纳什均衡,下证明这是一个子博弈精炼纳什均衡。 因为博弈重复无穷多次,从任何阶段开始的子博弈与原博弈的结果相同,故符合子博弈精炼纳什均衡的概念。 这即证明冷酷战略是无限次囚徒博弈的一个子博弈精炼纳什均衡。(抵赖,抵赖)是每一阶段的均衡结果,囚徒走出了困境。 (解释δ≥1/8的作用) 这背后的原理是:如果博弈重复无穷多次,且每个参与人有足够的耐心,任何短期的机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义行为。 另外,可以证明团体的合作除依赖于规则之外,还与团体中人员多少有关,人数越多,越不容易合作。这也解释:干坏事的合伙人越多,事情越容易败露。 无名氏定理 四.不完全信息重复博弈 我们知道在完全信息条件下,通过有限次重复博弈解决不了不合作问题,囚徒走不出困境。而在不完全信息条件下,如果囚徒1带有一定的非理性,即囚徒1有两个类型{理性,非理性},概率分别为P和1-P。假定囚徒2只有一个类型是理性的,非理性囚徒只有一种策略,即“针锋相对”,开始选择抵赖,然后在t阶段选择囚徒2在t-1阶段的选择。这里,C—坦白(不合作),D—抵赖(合作)。 囚徒博弈进行两次 t=1 t=2 非理性囚徒1 D X 理性囚徒1 C C 囚徒2 X C 在t=2时,囚徒2和理性囚徒1只选择C,非理性1的选择依赖于囚徒2在t=1的选择。 在t=1时,非理性1选D(假定),理性1选C,囚徒2选X。 (1)若X=D,2的支付为: P(-1)+(1-P)(-10)+[P*0+(1-P)(-8)]=17P-18 (2)若X=C,2的支付为: [P*0+(1-P)(-8)]+(-8)=8P-6 若(1)≥(2),即17P-18≥ 8P-6或P≥2/9时,囚徒2将在t=1时选择合作(抵赖)。 KMRW(Kreps,D.,P.Milgrom,J.Roberts,R.Wilson)定理 在T阶段重复囚徒博弈中,如果每个囚徒都有P0的概率是非理性的(即只选择“针锋相对策略”或“冷酷策略”),如果T足够大,那么存在一个T0T,使得下列策略组合构成一个精炼贝叶斯均衡: 所有理性囚徒在t≤T0阶段选择合作(抵赖),在tT0阶段选择不合作(坦白),而且非合作阶段的数量(T-T0)只与P有关而与T无关。 * * * * * * 五.信号传递博弈 信号传递博弈举例 讨论如下页图所示的两类型信号传递博弈,注意,这里“自然”赋予每一类型的可能性是相同的,我们用 (p,1-p) 和 (q,1-q) 表示接受者在其两个信息集内的 贝叶斯推断。 从图中可以看出,这一个两类型、两信号的博弈有四个可能的精炼贝叶斯均衡: (1)混同均衡于m1,发送者的策略为m(t1)=m(t2)=m1,即(m1, m1),则接收者对应于m1的信息集处于均衡路径上,接收者在这一信息集内的推断(p,1-p)决定于贝叶斯法则和发送者的策略。由于此时接收者无法通过信号纠正先验概率,故接收者的推断p=0.5.给定这样的推断,接收者在观测到m1之后的最有反应是a1,类型t1和类型t2的发送者分别得到的支付为1和2。为确定是否两种类型的发送者都愿意选择m1,需要考察m2时接收者将如何反应。如果接收者对m2的反应为a1,则类型t1的发送者选择m2的支付2大于选择选择m1的支付1。但如果接收者对m2的反应为a2,则发送者选择m2,t1和t2类型的支付将分别是0和1,低于选择m1时的1和2。 那么如果存在一个均衡,其中发送者的策略为(m1,m1),则接收者对m2的反应必须为a2.于是接收者的策略必须是(a1,a2).另外,
文档评论(0)