博弈论完整[浙江大学]GAME_Chapter3.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论完整[浙江大学]GAME_Chapter3

大学课件 大学课件 现在分析无限次重复囚徒困境博弈。我们将证明 尽管阶段博弈中唯一的NE是不合作的(招认, 招认),在有限次重复时,唯一的子博弈完美NE 还是在每个阶段都(招认,招认),可是在无限次 重复(在可预见的将来不会结束)进行的情况下, 只要参与人有足够的内心(即δ足够接近1),每个 阶段的行动组合为(沉默,沉默) 将形成一条子博 弈完美NE的路径。 考虑参与人的触发策略:在第一阶段选择不坦 白,且在之后的任意阶段t,如果之前的(t-1) 阶段的结果是双方都不坦白,则继续选择不坦 白,否则从t阶段开始永远选择坦白。 * 大学课件 Chapter 3 Repeated Games ?In this chapter we analyze whether threats and promises about future behavior can influence current behavior in repeated relationships. Much of the intuition is given in the two-period case; a few ideas require an infinite horizon. 区分:repeated games and sequential games 大学课件 张维迎P207—209 Sequential game的特征:参与人在前一阶段的 行动选择决定随后的子博弈的结构,因此,从 后一个决策结开始的子博弈不同于从前一个决 策结开始的子博弈,或者说,同样结构的子博 弈只出现一次。 Repeated game,顾名思义,就是同样结构的 博弈重复多次,其中每一次博弈称为阶段博 弈Stage game(也称为原博弈)。 Repeated Game的基本特征有3项: 大学课件  1、阶段博弈之间没有“物质上”的联系(no Physical links),也就是说,前一阶段博弈 不改变后一阶段博弈的结构(对比之下,序惯 博弈涉及到物质上的联系);  2、所有参与人都观测到博弈过去的历史;  3、参与人的总支付是所有阶段支付的贴现 值之和或加权平均值。 ?1:阶段博弈本身可能是一个静态博弈, 也可能是一个动态博弈。因此重复博弈可能是 不完美信息博弈,也可能是完美信息博弈,尽 管博弈论专家谈到重复博弈时一般是指前一种 情况。 大学课件  ?2:分析重复博弈的意义 因为其他参与人 过去行动的历史是观测得到的,一个参与人可以 使自己在某个阶段博弈的选择依赖于其他参与人 过去的行动历史,因此,参与人在重复博弈中的 策略空间远远大于和复杂于每一个阶段博弈的策 略空间(试想囚徒困境博弈重复5次,每个 囚徒的纯策略数量会有多少?策略组合的数量会 更多)。这意味着,重复博弈可能带来一些“额 外的”均衡结果,这些结果在一次性博弈中是不 会出现的。 ?3影响重复博弈均衡结果的主要因素是重复 博弈的次数和信息的完备性(completeness). 大学课件 重复次数的重要性来自于参与人在短期利益和 长期利益之间的权衡。当博弈只进行一次,参 与人只关心一次性的支付;但如果博弈重复多 次,参与认可能会为了长远利益而牺牲眼前利 益从而选择不同的均衡策略。这是重复博弈分 析给出的一个强有力的结果,它为现实中观测 到的许多合作行为和社会规范提供了解释。 信息不完备的影响将在下一章讨论,这里只讨 论重复次数对均衡结果的影响,并假定信息是 完备的。 大学课件 一、有限次重复博弈 (以two-stage repeated games为例) 考虑曾经给出的囚徒困境的标准式(回忆并 画出支付矩阵)。 假设两个参与者要把这样一个同时行动博弈重 复两次,并且在第二次博弈开始之前可观测第一次的结果。再假设整个过程博弈的收益等于两阶段各自收益的简单相加(即不考虑贴现因素),我们称这一重复进行的博弈为两阶段囚徒困境。 (一)阶段博弈只有唯一NE 大学课件 回忆第二章第四节的“有同时选择的两阶段动态博弈”。 两阶段囚徒困境其实属于这种类型博弈。无非这 里的参与人3、4与参与人1、2是相同的,行动空 间A3、A4 也与A1 、A2相同,并且总收益 μi(a1,a2, a3, a4)等于第一阶段结果(a1,a2)的收益与 第二阶段结果 (a3, a4)的收益简单相加。 在“有同时选择的两阶段动态博弈”中第二阶 段参与人3和4的稳定行动依赖于第一阶段的可 行结果(a1,a2),表示为(a3*(a1,a2), a4*(a1,a2)),而 不是简单的(a3*, a4*)(关税博弈中第二阶段企业的 均衡产量依赖于政府第一阶段所选择的关税). 大学课件 而在两阶段囚徒困境中,第二阶

文档评论(0)

bbnnmm885599 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档