博弈论第三章完全信息动态博弈.pptVIP

下载本文档

6
0
约1.34万字
约 61页
2016-03-29 发布于湖北
举报
版权申诉

博弈论第三章完全信息动态博弈.ppt

1、本文档共61页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论第三章完全信息动态博弈.ppt

第三章完全信息动态博弈 3.1 动态博弈的表示法和特点定义与博弈树博弈的展开式所包含的信息和内容: ⑴ 参与人的集合,记为i=1,2,…n,用N代表虚拟的参与人“自然”; ⑵ 行动的次序, 即谁在什么时候行动; ⑶ 参与人的行动空间,即轮到某参与人行动时,他从该时刻的纯策略空间中选取什么策略; ⑷ 当参与人作出他们的行动决策时,他所观测到或他所了解到的信息,即他在此时获得的信息集合; ⑸ 参与人的得益(支付或效用), 它们是已知行动的函数; ⑹ 在任何外生事件的概率分布。例房地产开发博弈　　有两个房地产开发商(分别为参与人1,记为A和参与人2,记为B) 在某地开发房地产, 但该地的房地产需求状况是不确定的, 假定该博弈的行动顺序如下:(1) 开发商1先行动, 选择开发或不开发;(2)在1决策后,“ 自然”选择需求的大小;(3)开发商2在观测到1的决策和市场的需求后, 再决定开发或不开发。( 如下图) 房地产开发博弈上述博弈树给出了有限博弈的几乎所有信息。博弈树必须满足下列规则：每一个结(node)至多有一个其他结直接位于它的前面; 在博弈中没有一条路径可以使决策集与自身相连; 每一个结是唯一初始结的后续结, 即博弈树必须有初始结; 每个博弈树“正好”只有一个初始结(多于一个可以用“ 自然”连接。不允许出现的情况：由以上规则，对于博弈树中的每一个终点结，我们，完全可以确定从初始结到终点结的路径，同时也展示了博弈的动态过程。信息集:博弈树上的所有决策集分割成不同的信息集，我们用h∈H来表示这个信息。如果一个信息集包含结x,我们就可以将该信息集记为h(x), 如果一个信息集只包含一个结,这是最简的情况。我们主要关心的是一个信息集包含不止一个结, 假设x与x′∈h(x),则恰好拥有信息h(x)并正在选择自己行动的参与人其实对自己究竟是处于x还界x′是不确定的。要求：如果x′∈h(x), 则x与x′ 应该由同一个参与人采取行动，且可以选择的策略空间相同：A(x)=A(x′), 由此可以将信息集h上的行动集记为A(h)。如果博弈树的所有信息集都是单结的, 则称该博弈为完美(perfect)息博弈。(无虚线连接),而完全(complete)信息博弈是指得益函数和纯策略空间均为博弈各方的共同知识。完全信息可以是完美的也可以是不完美的。 3.2 展开型博弈的策略与均衡一、行为策略在策略型博弈中, 参与人的策略是进行博弈的计划( 或打算)的详细集合, 而在展开型博弈中参与人的策略必须确定在该参与人的每一个决策集上所采取的行动,又结与信息集紧密相连, 对于参与人i,基于信息hi的行动的的全体记汉A(hi),如果令Hi表示参与人i的信息集的集合,则Ai= ∪ A(hi)就是参与人i的所有行动的集合。参与人i的一个纯策略是从Hi到Ai的一个映射si:对每一个hi∈Ai,si(hi)∈Ai,所有这些si的全体记为Si,即的的纯策略空间Si,由此: Si= × A(hi) 例参与人2有两个策略集,相应地也有两个信息集 A(h2(1))=A(h2(2))={左,右} 其中H2={h2(1),h2(2)};参与人2的纯策略空间为: S2=(A(h2(1)),Ah2(2))={(左,右)×(左,右)} ={(左,左),(左,右),(右,左),(右,右)},其中纯策略 (左,左)表明:当1取“上”时,2取“左”;当1取“下”时,2取“左”,…… 参与人1有三个信息集H1={hi(i),i=1,2,3},1的纯策略空间为:S1=A(h1(1))×A(h1(2))×A(h1(3)) ={(上,下)×(A,B)×(C,D)},共8种纯策略。一般地,参与人I的纯策略空间的纯策略数目为: ＃Si= Π ＃(A(hi)) 　　展开型博弈中纯策略是由信息集与行动集定义的( 与静态博弈不同,静态博弈中采取纯策略与采取某行动是一个意思)。纯策略组合(剖面profile)是由参与人各自的纯策略空间中的任一纯策略构成的组合，在任一纯策略组合s下，总可以从初始结开始，沿着博弈树的某条路径(path), 达到s相应的终点结。有一个事实非常重要：s中有些信息集在博弈树的这条路径上，我们称这些信息集是s的路径(path), 当然也可能存在s中某些信息集不在此路径上。　　定义了纯策略的得益函数后，我们就可以定义展开型