第十二讲重复博弈.ppt

下载文档 降价啦

20
0
约 54页
2017-09-29 发布于广西
举报
版权申诉
保障服务

第十二讲重复博弈.ppt

1、本文档共54页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

* 一、企业提供优质品的条件生产劣质品的一次性得利是pq 生产优质品的无穷次性得利是 * 企业提供优质品的充分必要条件 * 二、竞争性条件当期利润＝固定资本折旧 q（p-c）=rF 当价格p=(1+r)c时 Q=F/c * 三、市场出清条件 nq=q(p) n=q(p)/q=cq(p)/F * 第四节.不完全信息重复博弈与声誉一、问题的提出在完全信息情况下，假定静态博弈的纳什均衡是唯一的，不论博弈重复多少次，只要重复的次数是有限的，唯一的子博弈精炼纳什均衡是每个参与人在每次博弈中选择静态均衡战略。 * 特别地，在有限次重复囚徒博弈中，每次都选择“坦白”是每个囚徒的最优战略。这一结果与人们的直观感觉不一致。阿克斯罗德（ 1981）的实验结果表明，即使在有限次重复博弈中，合作行为也频繁出现。 * 二、悖论的破解：声誉模型克瑞普斯、米尔格罗姆、罗伯茨和威尔逊（1982）将不完全信息引入重复博弈参与人对其他参与人支付函数或策略的不完全信息对均衡结果有重要影响，合作行为在有限次博弈中会出现，只要博弈重复的次数足够长（没有必要是无限的）。特别地，“坏人”可能在相当长一段时期表现得像“好人”一样。 * （一）假定囚徒1有两种类型，理性的（rational）或非理性的（irrational），概率分别为（1-p）和p。为简单起见，假定囚徒2只有一种类型，即理性的。理性的囚徒可以选择任何战略， * 非理性的囚徒1，只有一种战略，即“针锋相对”（tit-for-tat）：开始选择“抵赖”，然后在t阶段选择囚徒2在t-1阶段的选择即 “你抵赖我就抵赖，你坦白我就坦白”）。 * “理性囚徒” 可以理解为“机会主义者” 或者非合作型参与人； “非理性囚徒” 可以理解为讲义气重信誉的人，或者合作型参与人。说囚徒1可能是非理性的并不是说他的行为是非理性的（即不追求效用最大化），而是说他有一种特殊的效用函数。 * 囚徒2 囚徒1 坦白抵赖坦白 -8，-8 0，-10 抵赖 -10，0 -1，-1 （二）.阶段博弈的收益矩阵 * （三）.博弈的顺序如下：（1）、自然首先选择囚徒1的类型；囚徒1知道自己的类型，囚徒2只知道囚徒1,属于理性的概率是（1-p），非理性的概率是p；（2）、两个囚徒进行第一阶段博弈； * (3)、观测到第一阶段博弈结果后，进行第二阶段博弈；观测到第二阶段博弈结果后，进行第三阶段博弈；如此等等。 (4)、理性囚徒1和囚徒2的收益是阶段博弈的支付的贴现值之和（为了简单起见，我们假定贴现因子δ=1）。 * Ⅰ.博弈只重复两次（T=2）的情况。 t=1 t=2 非理性囚徒1 D X 理性囚徒1 C C 囚徒2 X C C代表“坦白” ，D代表抵赖 * 如果囚徒2选择X=D，囚徒2的期望支付是 [p(-1)+(1-p)(-10)]+[p×0+(1-p)(-8)] =17p-18 * 如果囚徒2选择X=C，囚徒2的期望支付是： [p×0+(1-p)(-8)]+[-8]=8p-16 * 因此，如果下列条件满足，囚徒2将选择X=D： 17p-18≥8p-16→p≥2/9 就是说，如果囚徒1属于非理性的概率不小于2/9，囚徒2将在第一阶段选择抵赖（合作）。 * Ⅱ.博弈重复三次（T=3）的情况 t=1 t=2 t=3 非理性囚徒1 D D D 理性囚徒1 D C C 囚徒2 D D C p≥2/9 * Ⅲ.一般情况在T阶段重复囚徒博弈中，如果每个囚徒都有P0的概率是非理性的（即只选择“针锋相对”或“冷酷战略”），且T足够大，那么存在一个T0T，使得下列战略组合构成一个精炼贝叶斯均衡：所有理性囚徒在t≤T0阶段选择合作（抵赖），tT0阶段选择不合作（坦白）； * “非合作阶段的数量（T- T0）只与p有关而与T无关” T只决定合作阶段的数量而不决定非合作阶段的数量。 * （四）.直观解释尽管每一个囚徒在选择合作时冒着被其他囚徒出卖的风险（从而可能得到一个较低的现阶段支付），但如果他选择不合作，就暴露了自己是非合作型的，从而失去了获得长期合作收益的可能，如果对方是合作型的话。 * 如果博弈重复的次数足够多，未来收益的损失就超过短期被出卖的损失，因此，在博弈的开始，每一个参与人都想树立一个合作形象（使对方认为自己是喜欢合作的），即使他在本性上并不是合作型的；只有在博弈恰似结束的时候，参与人才会一次性地把自己的过去建立的声誉利用尽，合作才会停止（因为此时，短期收益很大而未来损失很小）。 * 一个人干好事还是干坏事常常不取决于他是好人还是坏人，而取决于别人认为他是好人还是坏人，因为坏人也有兴趣建立