博弈论及其经济学应用01.ppt

下载文档

20
0
约1.67万字
约 133页
2017-11-05 发布于江苏
举报
版权申诉
保障服务

博弈论及其经济学应用01.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

博弈论及其经济学应用01

证明：1.冷酷战略是纳什均衡。由于是无限次博弈，不能用逆推归纳法求解。令δ为二者相同的贴现因子。假定囚徒j选择上述冷酷战略，冷酷战略是否是i的最优战略呢？如果i在某阶段选择坦白，该阶段收益为0不是-1，但这将触发j的“永远坦白”的惩罚，因此i随后每个阶段的收益均为-8。如果0+δ(-8)+δ2(-8)+…≤-1+δ(-1)+δ2(-1)+… 或δ*≥1/8。i将不会选择坦白。就是讲，在δ≥1/8时，给定j坚持冷酷战略，并且j没有首先坦白，i不会选择首先坦白。若j首先选择了坦白，由于j坚持冷酷战略，j以后永远选择坦白，这时i坚持冷酷战略每阶段收益为-8，否则为-10，即i有积极性坚持冷酷战略。由于对称性知，给定i选择冷酷战略，j也有积极性坚持冷酷战略。上述证明了这是一个纳什均衡，下证明这是一个子博弈精炼纳什均衡。因为博弈重复无穷多次，从任何阶段开始的子博弈与原博弈的结果相同，故符合子博弈精炼纳什均衡的概念。这即证明冷酷战略是无限次囚徒博弈的一个子博弈精炼纳什均衡。（抵赖，抵赖）是每一阶段的均衡结果，囚徒走出了困境。（解释δ≥1/8的作用）这背后的原理是:如果博弈重复无穷多次，且每个参与人有足够的耐心，任何短期的机会主义行为的所得都是微不足道的，参与人有积极性为自己建立一个乐于合作的声誉，同时也有积极性惩罚对方的机会主义行为。另外，可以证明团体的合作除依赖于规则之外，还与团体中人员多少有关，人数越多，越不容易合作。这也解释：干坏事的合伙人越多，事情越容易败露。无名氏定理四.不完全信息重复博弈我们知道在完全信息条件下，通过有限次重复博弈解决不了不合作问题，囚徒走不出困境。而在不完全信息条件下，如果囚徒1带有一定的非理性，即囚徒1有两个类型{理性，非理性}，概率分别为P和1-P。假定囚徒2只有一个类型是理性的，非理性囚徒只有一种策略，即“针锋相对”，开始选择抵赖，然后在t阶段选择囚徒2在t-1阶段的选择。这里，C—坦白（不合作），D—抵赖（合作）。囚徒博弈进行两次 t=1 t=2 非理性囚徒1 D X 理性囚徒1 C C 囚徒2 X C 在t=2时，囚徒2和理性囚徒1只选择C，非理性1的选择依赖于囚徒2在t=1的选择。在t=1时，非理性1选D（假定），理性1选C，囚徒2选X。（1）若X=D，2的支付为: P(-1)+(1-P)(-10)+[P*0+(1-P)(-8)]=17P-18 （2）若X=C，2的支付为: [P*0+(1-P)(-8)]+(-8)=8P-6 若（1）≥（2），即17P-18≥ 8P-6或P≥2/9时，囚徒2将在t=1时选择合作（抵赖）。 KMRW(Kreps,D.,P.Milgrom,J.Roberts,R.Wilson)定理在T阶段重复囚徒博弈中，如果每个囚徒都有P0的概率是非理性的（即只选择“针锋相对策略”或“冷酷策略”），如果T足够大，那么存在一个T0T，使得下列策略组合构成一个精炼贝叶斯均衡：所有理性囚徒在t≤T0阶段选择合作（抵赖），在tT0阶段选择不合作（坦白），而且非合作阶段的数量(T-T0)只与P有关而与T无关。 * * * * * * 五.信号传递博弈信号传递博弈举例讨论如下页图所示的两类型信号传递博弈，注意，这里“自然”赋予每一类型的可能性是相同的，我们用 (p,1-p) 和 (q,1-q) 表示接受者在其两个信息集内的贝叶斯推断。从图中可以看出，这一个两类型、两信号的博弈有四个可能的精炼贝叶斯均衡：（1）混同均衡于m1,发送者的策略为m(t1)=m(t2)=m1，即(m1, m1),则接收者对应于m1的信息集处于均衡路径上，接收者在这一信息集内的推断(p,1-p)决定于贝叶斯法则和发送者的策略。由于此时接收者无法通过信号纠正先验概率，故接收者的推断p=0.5.给定这样的推断，接收者在观测到m1之后的最有反应是a1，类型t1和类型t2的发送者分别得到的支付为1和2。为确定是否两种类型的发送者都愿意选择m1，需要考察m2时接收者将如何反应。如果接收者对m2的反应为a1，则类型t1的发送者选择m2的支付2大于选择选择m1的支付1。但如果接收者对m2的反应为a2，则发送者选择m2，t1和t2类型的支付将分别是0和1，低于选择m1时的1和2。那么如果存在一个均衡，其中发送者的策略为(m1,m1)，则接收者对m2的反应必须为a2.于是接收者的策略必须是(a1,a2).另外，