- 1、本文档共56页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[管理学]三章完全且完美动态博弈
第三章 完全且完美动态博弈 博弈种类:静态,动态;完全信息,不 完全信息;完美信息,不完美信息 3.1 动态博弈的表示法和特点 动态博弈根本特征是各博弈方不是同时的,而是先后、依次进行选择或行动。 信息不对称:后行为的博弈方有更多的信息帮助自己选择行为。 具有较多信息就一定有较好结果并不总是成立; 单人博弈,两人博弈 完美博弈与不完美博弈 3.1.1 阶段和扩展形(扩展式)表示 各博弈方选择行动有先后次序,各博弈方的选择行动会形成依次相连的时间阶段,因此,动态博弈中一个博弈方的一次选择行动常称为一个“阶段”(stage)。 动态博弈中也可能存在几个博弈方同时选择的情况,这时这些博弈方的同时选择构成一个阶段。 一个动态博弈至少有两个阶段。动态博弈又称“多阶段博弈”(multistage games),又称“序列博弈”(“序贯博弈”)(sequential games)。 ? 通过选择节点、从选择节点出发表示博弈方各种可能选择的线段,以及博弈终端处的得益数组表示动态博弈的方法。这种表示法称为“扩展形”(“扩展式”),“博弈树”。 扩展式可以反映动态博弈中博弈方的选择次序和博弈的阶段,因此是表示动态博弈的最佳方法。因此,动态博弈有时被称为“扩展式博弈”(extensive form game) 枝 信息集 3.1.2 动态博弈的基本特点 动态博弈的策略和结果 静态博弈:博弈方一次性同时选择的行动(行为)就是博弈方的策略,这些策略的策略组合,以及所对应的各方得益,就是博弈的结果。 动态博弈:动态博弈博弈方决策的内容,也是决定博弈结果的关键,不是博弈方在单个阶段的行为,而是各博弈方在整个博弈中轮到选择的每个阶段,针对前面阶段的各种情况作相应选择和行为的完整计划,以及由不同博弈方的这种计划构成的组合。这种计划就是动态博弈中博弈方的“策略”。 动态博弈的非对称性 先后次序,且后行动者能观察到此前选择行动博弈方的选择行动,地位是不对称的。[同样存在,信息综合症]。 3.2 可信性(可信度)和纳什均衡的问题 所谓可信性是指动态博弈中先行为的博弈方是否该相信后行为的博弈方会采取对自己有利的或不利的行为。 后行为方将来会采取对先行为方有利的行为相当于一种“许诺”,而将来会采取对先行为方不利的行为相当于一种“威胁”,因此我可将可信性分为“许诺的可信性”和“威胁的可信性”。 3.2.1 相机选择和策略中的可信性问题 动态博弈中,博弈方的策略是他们自己预先设定的,在各个博弈阶段,针对各种情况的相应行动选择的计划。这种策略实际上没有强制力,而且实施起来有一个过程,因此只要符合博弈方自己的利益,他们完全可以在博弈过程中改变计划。我们称这种问题为动态博弈中的“相机选择”(contingent play)问题。 相机选择的存在使得博弈方的策略中,所设定的各个阶段、各种情况下会采取行为的“可信性”(credibility)有了疑问。 3.2.2 逆推归纳法(逆向归纳法) 逻辑基础:动态博弈中先行动的理性的博弈方,在前面阶段选择行动时,必然会考虑后行动博弈方在后面阶段中将会怎样选择行动,只有在博弈的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能直接作出明确选择。而当后面阶段博弈方的选择确定以后,前一阶段博弈方的行动也就容易确定了。 方法:从动态博弈的最后一个阶段开始分析,每一次确定所分析阶段博弈方的选择和路径,然后再确定前一个阶段的博弈方选择和路径。逆推归纳到某个阶段,那么这个阶段及以后的博弈结果就可以肯定下来,该阶段的选择节点等于一个结果终端。我们甚至可以用不包括该阶段与其后所有阶段博弈的等价博弈来代替原来的博弈。 方法:就是从动态博弈的最后一个阶段或最后一个子博弈开始,步向前倒推以求解动态博弈的方法. 逆推归纳法把多阶段动态博弈化为一系列的单人博弈,通过对一系列单人博弈的分析,确定各博弈方在各自选择阶段的选择,最终对动态博弈结果,包括博弈的路径和各博弈方的得益等作出判断,归纳各个博弈方各阶段的选择则可得到各个博弈方在整个动态博弈中的策略。 逆推归纳法确定的各个博弈方在各阶段的选择,都是建立在后续阶段各个博弈方理性选择的基础之上,因此自然排除了包含不可置信的威胁或承诺的可能性,因此得出的结论是比较可靠的,确定的各博弈方的策略组合是稳定的。 3.3 子博弈和子博弈完美纳什均衡 3.3.1 子博弈 定义:子博弈即能够自成一个博弈的某个动态博弈的从其某个阶段开始的后续阶段,它必须有一人初始信息集,且具备进行博弈所需要的各种信息 3.3.2 子博弈完美纳什均衡 定义1: 如果在一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博
文档评论(0)