lec4_完全信息动态博弈.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
lec4_完全信息动态博弈

完全信息动态博弈 He Is a Fool That Thinks Not That Another Thinks ——Herbert 动态博弈的概念 一类博弈行为通常需要参与人多步决策才能完成,具有明显的阶段性。 博弈的结局、各参与人的支付值由多阶段决策结果确定。 各参与人的决策有一定的顺序。 具有动态博弈的例子。 动态博弈的概念 由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性,通常用扩展式(extensive form)表述法描述这些信息。 博弈的扩展式表示 参与人集合:i=1, … ,N。此外,用0表示虚拟参与人“自然”; 自然的含义是某些外生的客观概率分布事件 参与人的行动顺序(the order of moves):描述各参与人在什么时候行动; 参与人的行动空间(action set):在每次行动时,参与人可选择的行动集合; 博弈的扩展式表示 参与人的信息集(information set):每次行动时参与人知道什么; 参与人的支付函数:在行动结束之后,每个参与人得到些什么。 自然选择的概率分布(假定自然状态是共同知识)。 对于有限博弈,博弈树是常用的表述方式。 扩展式表述简例 图2-1就是一个商品仿冒和反仿冒动态博弈的扩展型描述。 扩展式表述简例 图2-2是包括自然选择的博弈扩展式表述 博弈树 若动态博弈是有限博弈,则可用博弈树表示该博弈。这里有限的含义是 各阶段各参与人的行动数目有限 博弈的阶段数有限 博弈树 博弈树的基本结构为 结点(nodes)。包括决策结及终点结。 枝(branches)。在各决策结点出发的枝,与该结点对应的参与人所采取的行动一一对应。 博弈树 博弈树不允许如下形式的结点、枝的存在。 博弈树 信息集:是决策结集合的一个子集。 每个决策结都是同一个参与人的决策结。 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟出于哪一个决策结(若该信息集有两个或两个以上元素)。 博弈树 信息集的集合可记为H,则h∈H代表一个特定的信息集。 特别地,函数h(x)表示包含决策结x的信息集。 h(x)可解释为某个参与人不能确定他是否处在x或其他x’’ ∈H。 博弈树 对于有限动态博弈,若参与人对彼此在各决策结点的行动集合,彼此的效用函数,历史的行动有着完全的了解,则称这样的博弈为完全信息动态博弈。 如果博弈树的所有信息集都是单元素集,称该博弈为完美信息博弈(game of perfect information)。 上述两个定义的差别在于对自然行动信息的描述。 博弈树实例 注意图2-4中的信息集(图中用虚线连接的各结点)。 博弈树实例 注意,扩展式表述也可以用于分析静态博弈,如图2-5的囚徒问题。 一些说明 “完美回忆”(perfect recall)概念 完美回忆是指没有任何参与人会忘记自己以前知道的事情,所有参与人都知道自己以前的选择。 可以利用信息集概念描述完美回忆。 一些说明 图2-6描述了不完美回忆现象。 一些说明 “完美回忆”的数学描述 若x’和x’’属于同一个信息集,即x’∈h(x’’),y’是x’的前列结(排在x’前面的决策结),且均属于同一参与人i。 那么,存在一个y’’(可能是y’本身),满足y’’ ∈h(x’), y’’是x’’的前列结。 在y’到达x’的行动与y’’到达x’’的行动完全一致。 一些说明 上述事实可用图2-7表述 一些说明 需要注意的是,若有些动态博弈的阶段很多乃至无限,或者参与人在一个阶段有许多可以选择的行为,这时采用博弈树表述将变得很困难,或者不可行。如下棋等。 此时应用文字描述或用数学抽象形式表述。 动态博弈的策略式表述 相机选择(contingent play) 动态博弈中参与人的策略是各自预先设定的,在博弈的各阶段,针对各种情况做出相应决策。我们称这种问题为动态博弈中的“相机选择”问题。 在战略式表述博弈中,参与人似乎是博弈开始之前就制定出了一个完全的相机选择,即“如果……发生,我将选择……”。 动态博弈的策略式表述 从扩展式表述构造战略式表述 假定开发商A先决策,开发商B观测到A的选择后决策。 那么博弈的扩展式表述如图2-8表述。 动态博弈的策略式表述 这是一个完美信息博弈(每个参与人的信息集是单结的)。 A只有一个信息集,两个可选择行动,因而A的行动空间也就是A的战略空间:SA=(开发,不开发)。 动态博弈的策略式表述 但B有两个信息集,每个信息集上有两个可选择的行动,因而B有四个纯战略,分别为 不论A开发还是不开发,我开发; A开发我开发,A不开发我不开发; A开发我不开发,A不开发我开发; 不论A开发与否,我不开发。 动态博弈的策略式表述 若把B的信息集从左到右排列,上述四个纯战略可以简单记为 {开发,开发} {开发,不开发} {不开发

文档评论(0)

xy88118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档