- 1、本文档共61页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论第三章完全信息动态博弈.ppt
第 三 章 完全信息动态博弈 3.1 动态博弈的表示法和特点 定 义 与 博 弈树 博弈的展开式所包含的信息和内容: ⑴ 参与人的集合,记为i=1,2,…n,用N代表虚拟的参与人“自然”; ⑵ 行动的次序, 即谁在什么时候行动; ⑶ 参与人的行动空间,即轮到某参与人行动时,他从该时刻的纯策略空间中选取什么策略; ⑷ 当参与人作出他们的行动决策时,他所观测到 或他所了解到的信息,即他在此时获得的信息 集合; ⑸ 参与人的得益(支付或效用), 它们是已知行动的函数; ⑹ 在任何外生事件的概率分布。 例 房地产开发博弈 有两个房地产开发商(分别为参与人1,记为A和参与人2,记为B) 在某地开发房地产, 但该地的房地产需求状况是不确定的, 假定该博弈的行动顺序如下:(1) 开发商1先行动, 选择开发或不开发;(2)在1决策后,“ 自然”选择需求的大小;(3)开发商2在 观测到1的决策和市场的需求后, 再决定开发 或不开发。( 如 下 图) 房 地 产 开 发 博 弈 上述博弈树给出了有限博弈的几乎所有信息。 博 弈 树 必 须 满 足 下 列 规 则: 每一个结(node)至多有一个其他结直接位于 它的前面; 在博弈中没有一条路径可以使决策集与自身 相连; 每一个结是唯一初始结的后续结, 即博弈树 必须有初始结; 每个博弈树“正好”只有一个初始结(多于一个 可以用“ 自 然”连接。 不允许出现的情况: 由以上规则,对于博弈树中的每一个终点结,我们,完全可以确定从初始结到终点 结的路 径,同时也展示了博弈的动态过程。 信息集:博弈树上的所有决策集分割成不同的信息集, 我们用h∈H来表示这个信息。如果一个信息集包含 结x,我们就可以将该信息集记为h(x), 如果一个信息 集只包含一个结,这是最简的情况。我们主要关心的 是一个信息集包含不止一个结, 假设x与x′∈h(x),则恰好拥有信息h(x)并正在选择自己行动的参与人其实对自己究竟是处于x还界x′是不确定的。 要 求: 如 果x′∈h(x), 则x与x′ 应 该由同 一个参与人采取行动,且可以选择的策略空 间相同:A(x)=A(x′), 由此可以将信息集h上 的行动集记 为A(h)。 如果博弈树的所有信息集都是单结的, 则称该 博弈为完美(perfect)息 博弈。(无虚线连接),而完全(complete)信息博弈是指得益函数和纯策略空间均为博弈各方的共同知识。完全信息可以是完美的也可以是不完美的。 3.2 展开型博弈的策略与均衡 一、 行 为 策 略 在策略型博弈中, 参与人的策略是进行博弈的计划( 或打算)的详细集合, 而在展开型博弈中 参与人的策略必须确定在该参与人的每一个决 策集上 所 采 取 的 行 动,又 结 与 信 息 集 紧 密 相 连, 对 于 参 与 人i,基于信息hi的行动的 的全体记汉A(hi),如果令Hi表示参与人i的信息集 的集合,则Ai= ∪ A(hi)就是参与人i的所有行动 的集合。参与人i的一个纯策略是从Hi到Ai的一个映射si:对每一个hi∈Ai,si(hi)∈Ai,所有这些si的全体记为Si,即的的纯策略空间Si,由此: Si= × A(hi) 例 参与人2有两个策略集,相应地也有两个信息集 A(h2(1))=A(h2(2))={左,右} 其中H2={h2(1),h2(2)};参与人2的纯策略空间为: S2=(A(h2(1)),Ah2(2))={(左,右)×(左,右)} ={(左,左),(左,右),(右,左),(右,右)},其中纯策略 (左,左)表明:当1取“上”时,2取“左”;当1取“下”时,2取“左”,…… 参与人1有三个信息集H1={hi(i),i=1,2,3},1的纯策略空间为:S1=A(h1(1))×A(h1(2))×A(h1(3)) ={(上,下)×(A,B)×(C,D)},共8种纯策略。 一般地,参与人I的纯策略空间的纯策略数目为: #Si= Π #(A(hi)) 展开型博弈中纯策略是由信息集与行动集定义 的( 与静态博弈不同,静态博弈中采取纯策略与 采取某行动是一个意思)。 纯策略组合(剖面profile)是由参与人各自的纯策 略空间中的任一纯策略构成的组合,在任一纯 策略组合s下,总可以从初始结开始,沿着博弈树的某条路径(path), 达到s相应的终点结。 有一个事实非常重要:s中有些信息集在博弈 树的这条路径上,我们称这些信息集是s的路 径(path), 当然也可能存在s中某些信息集不在 此路径上。 定义了纯策略的得益函数后,我们就可以定义 展开型
文档评论(0)