lec4_完全信息动态博弈.pptVIP

下载本文档

1
0
约2.08万字
约 164页
2018-03-21 发布于河南
举报
版权申诉

lec4_完全信息动态博弈.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

lec4_完全信息动态博弈

完全信息动态博弈 He Is a Fool That Thinks Not That Another Thinks ——Herbert 动态博弈的概念一类博弈行为通常需要参与人多步决策才能完成，具有明显的阶段性。博弈的结局、各参与人的支付值由多阶段决策结果确定。各参与人的决策有一定的顺序。具有动态博弈的例子。动态博弈的概念由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性，通常用扩展式(extensive form)表述法描述这些信息。博弈的扩展式表示参与人集合：i=1, … ,N。此外，用0表示虚拟参与人“自然”；自然的含义是某些外生的客观概率分布事件参与人的行动顺序(the order of moves):描述各参与人在什么时候行动；参与人的行动空间(action set)：在每次行动时，参与人可选择的行动集合；博弈的扩展式表示参与人的信息集(information set)：每次行动时参与人知道什么；参与人的支付函数：在行动结束之后，每个参与人得到些什么。自然选择的概率分布（假定自然状态是共同知识）。对于有限博弈，博弈树是常用的表述方式。扩展式表述简例图2-1就是一个商品仿冒和反仿冒动态博弈的扩展型描述。扩展式表述简例图2-2是包括自然选择的博弈扩展式表述博弈树若动态博弈是有限博弈，则可用博弈树表示该博弈。这里有限的含义是各阶段各参与人的行动数目有限博弈的阶段数有限博弈树博弈树的基本结构为结点(nodes)。包括决策结及终点结。枝（branches）。在各决策结点出发的枝，与该结点对应的参与人所采取的行动一一对应。博弈树博弈树不允许如下形式的结点、枝的存在。博弈树信息集：是决策结集合的一个子集。每个决策结都是同一个参与人的决策结。该参与人知道博弈进入该集合的某个决策结，但不知道自己究竟出于哪一个决策结（若该信息集有两个或两个以上元素）。博弈树信息集的集合可记为H,则h∈H代表一个特定的信息集。特别地，函数h(x)表示包含决策结x的信息集。 h(x)可解释为某个参与人不能确定他是否处在x或其他x’’ ∈H。博弈树对于有限动态博弈，若参与人对彼此在各决策结点的行动集合，彼此的效用函数，历史的行动有着完全的了解，则称这样的博弈为完全信息动态博弈。如果博弈树的所有信息集都是单元素集，称该博弈为完美信息博弈(game of perfect information)。上述两个定义的差别在于对自然行动信息的描述。博弈树实例注意图2-4中的信息集（图中用虚线连接的各结点）。博弈树实例注意，扩展式表述也可以用于分析静态博弈，如图2-5的囚徒问题。一些说明 “完美回忆”(perfect recall)概念完美回忆是指没有任何参与人会忘记自己以前知道的事情，所有参与人都知道自己以前的选择。可以利用信息集概念描述完美回忆。一些说明图2-6描述了不完美回忆现象。一些说明 “完美回忆”的数学描述若x’和x’’属于同一个信息集，即x’∈h(x’’)，y’是x’的前列结（排在x’前面的决策结），且均属于同一参与人i。那么，存在一个y’’(可能是y’本身)，满足y’’ ∈h(x’), y’’是x’’的前列结。在y’到达x’的行动与y’’到达x’’的行动完全一致。一些说明上述事实可用图2-7表述一些说明需要注意的是，若有些动态博弈的阶段很多乃至无限，或者参与人在一个阶段有许多可以选择的行为，这时采用博弈树表述将变得很困难，或者不可行。如下棋等。此时应用文字描述或用数学抽象形式表述。动态博弈的策略式表述相机选择(contingent play) 动态博弈中参与人的策略是各自预先设定的，在博弈的各阶段，针对各种情况做出相应决策。我们称这种问题为动态博弈中的“相机选择”问题。在战略式表述博弈中，参与人似乎是博弈开始之前就制定出了一个完全的相机选择，即“如果……发生，我将选择……”。动态博弈的策略式表述从扩展式表述构造战略式表述假定开发商A先决策，开发商B观测到A的选择后决策。那么博弈的扩展式表述如图2-8表述。动态博弈的策略式表述这是一个完美信息博弈（每个参与人的信息集是单结的）。 A只有一个信息集，两个可选择行动，因而A的行动空间也就是A的战略空间：SA=(开发，不开发)。动态博弈的策略式表述但B有两个信息集，每个信息集上有两个可选择的行动，因而B有四个纯战略，分别为不论A开发还是不开发，我开发； A开发我开发，A不开发我不开发； A开发我不开发，A不开发我开发；不论A开发与否，我不开发。动态博弈的策略式表述若把B的信息集从左到右排列，上述四个纯战略可以简单记为 {开发，开发} {开发，不开发} {不开发