博弈论完整[浙江大学]GAMEChapter3.PPTVIP

下载本文档

2
0
约7.48千字
约 45页
2017-11-20 发布于江苏
举报
版权申诉

博弈论完整[浙江大学]GAMEChapter3.PPT

1、本文档共45页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论完整[浙江大学]GAMEChapter3

现在分析无限次重复囚徒困境博弈。我们将证明尽管阶段博弈中唯一的NE是不合作的(招认，招认)，在有限次重复时，唯一的子博弈完美NE 还是在每个阶段都(招认，招认)，可是在无限次重复（在可预见的将来不会结束）进行的情况下，只要参与人有足够的内心(即δ足够接近1)，每个阶段的行动组合为(沉默，沉默) 将形成一条子博弈完美NE的路径。考虑参与人的触发策略：在第一阶段选择不坦白，且在之后的任意阶段t，如果之前的（t-1）阶段的结果是双方都不坦白，则继续选择不坦白，否则从t阶段开始永远选择坦白。 * Chapter 3 Repeated Games ?In this chapter we analyze whether threats and promises about future behavior can influence current behavior in repeated relationships. Much of the intuition is given in the two-period case; a few ideas require an infinite horizon. 区分：repeated games and sequential games 张维迎P207—209 Sequential game的特征：参与人在前一阶段的行动选择决定随后的子博弈的结构，因此，从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈，或者说，同样结构的子博弈只出现一次。 Repeated game，顾名思义，就是同样结构的博弈重复多次，其中每一次博弈称为阶段博弈Stage game（也称为原博弈）。 Repeated Game的基本特征有3项：　1、阶段博弈之间没有“物质上”的联系（no Physical links），也就是说，前一阶段博弈不改变后一阶段博弈的结构（对比之下，序惯博弈涉及到物质上的联系）；　２、所有参与人都观测到博弈过去的历史；　３、参与人的总支付是所有阶段支付的贴现值之和或加权平均值。 ?１：阶段博弈本身可能是一个静态博弈，也可能是一个动态博弈。因此重复博弈可能是不完美信息博弈，也可能是完美信息博弈，尽管博弈论专家谈到重复博弈时一般是指前一种情况。　?２：分析重复博弈的意义　因为其他参与人过去行动的历史是观测得到的，一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史，因此，参与人在重复博弈中的策略空间远远大于和复杂于每一个阶段博弈的策略空间（试想囚徒困境博弈重复５次，每个囚徒的纯策略数量会有多少？策略组合的数量会更多）。这意味着，重复博弈可能带来一些“额外的”均衡结果，这些结果在一次性博弈中是不会出现的。 ?３影响重复博弈均衡结果的主要因素是重复博弈的次数和信息的完备性（completeness）. 重复次数的重要性来自于参与人在短期利益和长期利益之间的权衡。当博弈只进行一次，参与人只关心一次性的支付；但如果博弈重复多次，参与认可能会为了长远利益而牺牲眼前利益从而选择不同的均衡策略。这是重复博弈分析给出的一个强有力的结果，它为现实中观测到的许多合作行为和社会规范提供了解释。信息不完备的影响将在下一章讨论，这里只讨论重复次数对均衡结果的影响，并假定信息是完备的。一、有限次重复博弈（以two-stage repeated games为例）考虑曾经给出的囚徒困境的标准式（回忆并画出支付矩阵）。假设两个参与者要把这样一个同时行动博弈重复两次，并且在第二次博弈开始之前可观测第一次的结果。再假设整个过程博弈的收益等于两阶段各自收益的简单相加（即不考虑贴现因素），我们称这一重复进行的博弈为两阶段囚徒困境。（一）阶段博弈只有唯一NE 回忆第二章第四节的“有同时选择的两阶段动态博弈”。两阶段囚徒困境其实属于这种类型博弈。无非这里的参与人3、4与参与人1、2是相同的，行动空间A3、A4 也与A1 、A2相同，并且总收益 μi(a1,a2, a3, a4)等于第一阶段结果(a1,a2）的收益与第二阶段结果 (a3, a4)的收益简单相加。在“有同时选择的两阶段动态博弈”中第二阶段参与人3和4的稳定行动依赖于第一阶段的可行结果(a1,a2)，表示为(a3*(a1,a2), a4*(a1,a2))，而不是简单的(a3*, a4*)(关税博弈中第二阶段企业的均衡产量依赖于政府第一阶段所选择的关税）. 而在两阶段囚徒困境中,第二阶段的NE可以完全不依赖于第一阶段的结果。分析时要注意3点： ?1 逆推归纳法backwards-