完全信息动态博弈.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
完全信息动态博弈 第一节 扩展型博弈 第二节 子博弈完美均衡 《凶残海盗的逻辑》 《凶残海盗的逻辑》中有一个智力题——海盗分金:5个海盗要分配抢来的100个金币,分配方式是第一个人提出分配方案,如果同意这种方案的达到半数,提议通过,否则提议的人扔进大海,由剩余的人再进行同样的过程。假设5个人的提议的次序已定,金币不能分割,而且海盗的本性让他们觉得,如果对自己的收益没有影响,则很乐意看到别人被扔进大海,这时理性结局应该如何? 这种博弈局势和策略型博弈的不同之处在于:其中存在着局中人行动的先后次序,更多的信息意味着有可能利用这些信息形成更严格的均衡概念?对这种具有动态结构的决策形势进行研究的规范分析工具是扩展型博弈。 第一节 扩展型博弈 扩展型博弈与策略型博弈的区别 1 、 其中存在着局中人行动的先后次序。 2、 它增加了对局中人行动次序与局中人行动 时所掌握信息的描述. 3、策略型博弈中常常利用矩阵形式作为一种清晰的表现手段,而扩展型博弈则利用博弈树来表现多个人有限策略博弈。 策略型博弈中各局中人同时一次性地选定策略,无法表现出他们选择的先后次序,如果我们要研究博弈的动态特征,就必须找到一种更适当的表述方式.结果就得到所谓的扩展型博弈。 一:扩展型博弈的构成 1:局中人 2:行动顺序,即谁在何时采取行动 3:行动空间,它表示在每次行动时,局中人可以进行哪些选择 4;信息集,它表示局中人进行选择时所知道的信息; 5:支付函数,即把局中人所获得的支付表示为其采取的行动的函数; 6.外生事件的概率分布,对此引入“自然”作为一个虚拟局中人,它在博弈中的作用只是在相应的地方在若干外生事件中根据一定概率分布随机选取,而没有自己的利益目标与支付函数。 二:博弈树 (一)博弈树的理解 1、这个博弈开始于一个起始决策点。 2、博弈树由一系列节点x 和它们之间的连线构成,这些节点之间存在着偏序关系。 3、博弈树是全排序的,即从博弈树的起点到博弈树中的任何一点只有惟一一条路径. 4、博弈的扩展式与博弈树是同义语。与博弈的基本式相比,博弈的扩展式特别善于描述复杂的博弈,博弈越复杂,博弈扩展式的优点就越突出。 博弈树 ◆ 囚徒困境的扩展型博弈 象棋的扩展式 (二)完美信息博弈与完美信息的违背 1、信息集: 1、1定义:实际上是参与者决策节点集合的一个子集。信息集的定义是当博弈进行到某个阶段,轮到某个参与者行动时,他不知道自己位于哪一个节点,不能加以区分的节点的集合就称为信息集。 参与者之所以不能对信息集中的节点进行区分,原因在于他对前面发生的其他参与者的(有些或全部)行动未能观察到。 囚徒困境的信息集 在图中,我们看到当博弈进行到囚徒2行动时,由于囚徒2未能观察到此前囚徒1的行动,所以囚徒2不能对节点X2和X3作出区分,也就是他不知道囚徒1到底选择的是什么策略。节点X2、X3的集合{X2,X3}即是囚徒2的一个信息集,集合{X1}即是囚徒1的信息集。习惯上,我们通常把位于同一个信息集的节点用虚线连接起来或者用圆圈圈起来,只包含—个节点的信息集就称为单点信息集 1、2、信息集的意义 第一,使用信息集可以清楚地描绘出当参与者行动时,他所处的“环境”和所有可能掌握的信息,因而能揭示出博弈的信息特征。 第二,信息集的使用还可以使静态博弈转化为动态博弈.在博弈的基本式和 扩展式之间架设了一道桥梁,博弈的扩展式成为能够描述所有博弈类型的有力工具。 第三,利用信息集概念,可以表现复杂的信息结构,描述动态博弈局势中局中人在行动时知道的各种信息。我们还可以利用扩展型博弈表现静态博弈 1、3 、信息集的规定: 第一,在任意一个信息集中的每一个节点上,参与者一定有相同的行动集合 原因非常简单,如果一个信息集中的两个节点包含的行动不一样,由于参与者在不同的节点具有不同的行动、因而他一定能对这两个节点作出区分。这就与信息集的定义相矛盾。 第二,信息集不得违背完美回忆的假定。 完美回忆假定当博弈中的参与者行动时,他对过去发生的一切情况都记得清清楚楚。显然完美回忆在现实生活中可能并不满足,因而我们把它看作一 种假定,但完美回忆在现实生活中也普遍存在,例如,打过桥牌的人就知道桥牌游戏就是一个典型的完美回忆。 (二)完美信息博弈与完美信息的违背 2、完美信息:指博弈中的每一个信息

文档评论(0)

seunk + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档