第讲完全信息动态博弈教材.ppt

下载文档 降价啦

7
0
约1.02万字
约 59页
2016-06-26 发布于湖北
举报
版权申诉
保障服务

第讲完全信息动态博弈教材.ppt

1、本文档共59页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第三讲完全信息动态博弈浙江工业大学经贸管理学院曹柬：jcao@zjut.edu.cn 静态：决策时点一致完全信息：掌握对方的类型及其策略空间、效用函数等动态：决策次序有先后，后决策者能观测到先决策者的行为（所采取的策略）一、博弈的扩展式表述二、子博弈精炼纳什均衡三、子博弈精炼纳什均衡应用举例四、重复博弈一、博弈的扩展式表述博弈的战略式表述包括：参与人集合；每个参与人的策略集合；由策略组合决定的每个参与人的效用。博弈的扩展式表述主要扩展的是参与人的策略空间。战略式表述简单地给出参与人有些什么战略可以选择，而扩展式表述主要给出每个策略的动态描述：谁在什么时候行动，每次行动有些什么具体行动可以选择，及其知道些什么。博弈的扩展式表述包括：参与人集合：并采用N表示虚拟参与人“自然”；参与人的行动顺序：谁在什么时候行动；参与人的行动空间：每次行动时，参与人有些什么选择；参与人的信息集：每次行动前，参与人了解些什么情况；参与人的效用函数：每次行动后，参与人会得到什么效用；外生事件：自然选择的概率分布。 n人有限策略博弈的扩展式表述可以用博弈树来表示，如“房地产开发博弈”，如图2.1所示，博弈的行动顺序如下：（1）A首先行动；（2）在A决策后，自然选择市场需求的大小；（3）B观测到A的选择和市场需求后，再进行决策。动态博弈从空心圆开始，A在此点决策；A决策后博弈进入实心圆（N的结点），表示自然开始行动；最后进入B的节点（也是实心圆），表示B开始决策。对应于不同的行动路径，可以得到不同的效用向量，向量中的数字次序与博弈树中参与人的决策顺序是一致的，例如，第一、二个数字分别对应于A和B的效用。博弈树的构造：结，枝和信息集。结(node)：包括决策结(decision node)和终点结(terminal node)，决策结是参与人采取行动的时点；终点结是博弈行动路径的终点。空心圆表示初始结，实心圆表示其他决策结。在博弈树中，从初始结到任何一个结只有唯一的路径。由于每一个终点结z完全决定了博弈树的路径，可以采用ui(z)表示对应的博弈路径所导致的第i个参与人的效用函数。信息集(information set)：博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集，信息集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参与人的决策结；(2)参与人知道博弈进入该信息集的某个决策结，但不知道自己究竟处于哪个决策结。一个信息集可能包含多个决策结，也可能只包含单个决策结。如果博弈树的所有信息集都是单结的，则该博弈可能是完美信息博弈。如何表述B知道自然的选择，而不知道A的选择。 “完美信息”和“完全信息”是两个不同的概念。完美信息是指一个参与人对其他参与人（包括虚拟参与人“自然”）的行动选择有准确的了解，每一个信息集中包含一个决策结。完美信息博弈是与动态博弈相关的。完全信息是指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况，即博弈前不存在事前的不确定性。无外生或内生事件。完全信息与动、静态博弈均可相关。完美信息必然是完全信息。不完全信息必然是不完美信息。二、子博弈精炼纳什均衡来看一个例子，市场需求低时，A先动，B后动。该博弈的扩展式表述为：从该博弈的战略式表述中，可以得到该博弈的三个纯策略纳什均衡：（开发，{不开发，开发}），（开发，{不开发，不开发}），（不开发，{开发，开发}）；均衡结果为（开发，不开发）和（不开发，开发）。是否这三个纯策略纳什均衡都是合理的？在这三个策略组合中，是否存在“不可置信的策略组合”？ B威胁A，不论A是否开发，B都将选择开发。如果A相信B的威胁，A的最好选择是不开发。但A为什么要相信B的威胁呢？如果B是理性的，在A选择了开发以后，B的最优选择只能是不开发。所以这个策略组合是不可置信的。子博弈：一个扩展式表述博弈的子博弈G由一个决策结x和所有该决策结的后续结T(x)（包括终点结）组成，它满足下列条件：（1）x是一个单结信息集，即h(x)＝x；（2）对应所有的，如果，那么。子博弈精炼纳什均衡：扩展式表述博弈的策略组合是一个子博弈精炼纳什均衡，如果（1）它是原博弈的纳什均衡；（2）它在每一个子博弈上都构成纳什均衡。 “序贯理性”（sequential rationality）是指不论过去发生了什么，参与人应该在博弈的每一个时点上最优化自己的决策。子博弈精炼纳什均衡要求参与人应该是序贯理性的。对于有限完美信息博弈，逆向归纳法是求解子博弈精炼纳什均衡的最简便方法