第七章 完全信息动态博弈预备知识.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 完全信息动态博弈预备知识

第八章完全信息动态博弈预备知识本章重点:理解动态博弈或是拓展博弈信息集的概念、完美信息与不完美信息注意区分完全信息和完美信息理解拓展博弈中的纯策略、混合策略和行为策略,以及清楚与静态博弈中的不同动态博弈的标准化表达,以及博弈路径本章主要内容一、拓展式博弈1博弈树2完美信息与不完美信息二、策略和纳什均衡1纯策略2混合策略和行为策略3拓展式博弈的标准式表达三、纳什均衡和博弈路径一、拓展式博弈 1.拓展式博弈需要具有以下要素:参与人集N作为结果函数的参与人支付行动顺序在参与人们能够行动时他们的行动参与人在其行动时所具有的知识外生事件上的概率分布由1-6表示的扩展式博弈的结构,是所有参与人间的共同知识2、博弈树(1)作用:博弈树不仅可以给出单个参与人决策问题的简单图形描述,也可以给出适于表达扩展式博弈的图形描述,将拓展式博弈中的各要素纳入其中。信任博弈参与人1首先选择是否请求参与人2的服务。他可以选择信任参与人2(T)或者不信任他(N),后一个选择给两个参与人的支付都为0。如果参与人1采取T,那么参与人2可以选择合作(C),这表示给参与人1某种公平的服务水平,或者选择(D),表示以一种劣质、低成本的服务来欺骗参与人1。假设如果参与人2选择合作,那么这两个参与人都会得到支付为1,而如果参与人2选择D,那么参与人1会得到支付-1,参与人2得到支付2。其中顶上的数字是参与人1的支付,底下的数字是参与人2的支付(2)博弈树的正式定义(3)信息集结点在上述博弈中,当参与人4选择行动时,他面临着一个难题,他不知道在他行动之前发生了什么,即他不知道他是位于x2还是位于x3。接下来我们就需要引入信息集的概念,以助于解决该问题性质1实际上就是说参与i在其做出选择之前,已经明确知道他处于何处。以参与人4为例,在性质1的条件下,其已知其具体是处于点x2或是点x3。也即或性质2要说明的是参与人i知道其面临哪几种情况,但具体哪一种确实未知的。以参与人4为例的话则是性质3是指,虽然参与人像性质2那样不知其所处何点,但是如论其处何点其都会做出相同的行动,也即。(4)同一信息集的结点的图示法在图7.4的左边,我们用一个椭圆来标示信息集,在同一个椭圆内的所有结点都属于同一个信息集。在图7.4中的右边是另外一种描述信息集的一般性方法,它用虚线连接,表示它们两个在同一个信息集之内。3.完美信息与不完美信息(1)定义1:完全信息博弈的每个信息集都是一个单点,而且没有自然的行动,这样的博弈被称为完美信息博弈(gameofperfectinformation)在一个完美信息博弈中,每个参与人都确切的知道他在博弈中的位置,因为他了解在他行动之前发生了什么。本章开篇提到的“信任博弈”便是完美信息博弈。(2)定义2:博弈的某些信息集包含若干个点或者存在自然的行动,这样的博弈则被称为不完美信息博弈(gameofimperfectinformation)。在一个(完全但)不完美信息博弈中,有些参与人不知道他所自处,因为有些信息集包含了不止一个结点。比如说,每次他们在不知道先前其他参与人的选择时行动,这种情况就出现了,这说明任一同时行动博弈都是一个不完美信息博弈。图7.4所表示的博弈因为参与人4的信息集包含2个结点,所以为不完美信息博弈。二、策略和纳什均衡1、拓展式博弈中的纯策略参与人i的纯策略是博弈的一个完备的计划,它描述了参与人i在他的每一个信息集上将会选择的纯行动。正式的定义:参与人i的纯策略是一个映射,它为每一个信息集赋予一个行动。我们用标示所有纯策略映射的集合。其中,纯策略个数为,此处参与人i有k个信息集,每个信息集中有个行动可选。同时行动性别战博弈在图7.7中的序贯行动性别战博弈中,参与人1的纯策略是参与人2有两个不同的信息集,于其间他可以选择o或f。纯策略是一个完备的行动计划,参与人2需要同时对这两个信息集选择相对应的行动,因此参与人2的纯策略集为:这里纯策略“ab”是“如果参与人1选择O,我将选择a;如果他选择F,我选择b。”2.混合策略定义:参与人i的一个混合策略是其纯策略上的一个概率分布。参与人随机的在所有他的纯策略上进行选择(在这种情况下是博弈的全部完备计划),而一旦某个计划被选出,该参与人就遵守这个计划。在上述性别博弈中,混合策略就是对纯策略集中的每一个策略赋予一个概率,且3.行为策略定义:行为策略与拓展式博弈的步调更一致,只要轮到他行动,参与人就在其行动之间进行混合。而在混合策略中参与人是在博弈之前进行混合,然后一直忠于选定的纯策略。在上述性别博弈中,参与人2所采取的行为策略则是,在参与人1选择o的情况下,参与人2分别以概率,采取行动o和f,且有=1.;参与人1选择f时,参与人2分别以概率采取行动o和f,且混合策略与行为策略的联系给定一个混合(非行为)策略,我们能

文档评论(0)

2266670 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档