扩展式博弈与纳什均衡.ppt

下载文档 降价啦

9
0
约3.44千字
约 19页
2016-03-31 发布于湖北
举报
版权申诉
保障服务

扩展式博弈与纳什均衡.ppt

1、本文档共19页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

扩展式博弈与纳什均衡.ppt

在静态博弈中，所有参与人同时行动（或行动虽有先后，但没有人在自己行动之前观测到别人的行动）；在动态博弈中，参与人的行动有先后顺序，且后行动者在行动之前能观测到先行动者的行动。通常用扩展式表述分析动态博弈。博弈的扩展式表述“扩展”的主要是参与人的策略空间。策略式表述简单地给出参与人有些什么策略可供选择，而扩展式博弈要给出每个策略的动态描述：谁在什么时候行动，每次行动有些什么具体行动可供选择，以及知道些什么。博弈的扩展式表述包括以下要素：（1）参与人集合：i=1,2,…n ；此外，将用N表示虚拟参与人“自然”。（2）参与人的行动顺序：谁在什么时候行动。（3）参与人的行动空间：每次行动时，参与人有些什么选择。（4）参与人的信息集：每次行动时，参与人知道些什么。（5）参与人的支付函数：行动结束后，参与人得到些什么（支付是所有行动的函数）。（6）外生事件（即自然的选择）的概率分布。如同两人有限策略博弈的策略式表述可用博弈矩阵表述一样，n人有限策略博弈的扩展式表述可用博弈树表示。以房地产开发为例。假定该博弈的行动顺序如下：（1）开发商A先行动，选开发或不开发；（2）在A决策后，自然选择市场需求的大小；（3）开发商B在观测到A的决策和市场需求后，决定开发或不开发。其博弈树如下表。博弈树给出了有限博弈的几乎所有信息，其基本构建包括： 1.结（nodes）：包括决策结（上面三个）和终点结（B的四个策结）。前者是参与人采取行动的时点，后者是博弈行动路径的终点。此例中，决策结包括1个空心圆和6个实心圆，终点结包括对应8个支付向量的点。 2.枝（ branches ）：枝是从一个决策结到它的直接后续结的连线，每一个枝代表参与人的一个行动选择。如A有两个选择，用“开发”和“不开发”两个枝表示。 3.信息集（information sets）。博弈树上的所有决策结分割成不同的信息集。每个信息集是决策结集合的一个子集，该子集满足下列条件：（1）每个决策结都是同一参与人的决策结；（2）该参与人知道博弈进入该集合的某个决策结，但不知道自己究竟处于哪一个决策结。引入信息集的目的在于描述：当一个参与人要作出决策时，他可能并不知道之前发生的所有事件。情形1：图8-1 中，假定B是在知道A和自然的选择后进行决策，此时，博弈树的7个决策结分割成7个信息集（每个信息集只包含一个决策结），意味着所有参与人在决策时准确地知道自己处于哪一个决策结。情形2：假定行动顺序如前，但B在决策时并不确切地知道自然的选择。此时，B的信息集由原来的4个变成2个，2个信息集分别对应着B的两个不同决策：若A开发，自己是否开发；若A不开发，B是否开发。用虚线将属于同一信息集的两个决策结连接起来（图8-2）。情形3：B知道自然的选择，但不知道A的选择（如B和A同时决策）。此时，B也有两个信息集，每个信息集包含两个决策结：两处信息集分别对应两种不同的决策：需求大是否开发和需求小是否开发（图8-3）。情形4：B知道N的选择但不知道A的选择，A不知道N的选择（图8-4）。情形5：A既不知道N的选择也不知道B的选择，但B知道N的选择（图8-5）。一个信息集可能包括多个决策结，也可能只包括一个决策结，后者叫做单结信息集。若博弈树的所有信息都是单结的，该博弈称为完美信息博弈，它意味着博弈中没有任何两个参与人同时行动，且所有后行动者能确切地知道前行动者选择了什么行动，所有参与人观测到自然的行动。在博弈树上，完美信息意味着没有任何两个决策结是用虚线连起来的。另外，扩展式表述也可用来描述静态博弈。试写出囚徒困境博弈的扩展式表述。从扩展式表述构造策略式表述。以房地产开发博弈为例。假定博弈开始之前自然就选择了“低需求”，且已成为共同信息；A先决策，B在观测到A的选择后再决策。则博弈的扩展式表述如下图（8-6）。注意：A只有一个信息集，两个可选择的行动，因而A的行动（策略）空间为SA=（开发，不开发）。但B有两个信息集，四个纯策略，即①不论A是否开发，我开发；②A开发，我开发，A不开发，我不开发；③A开发，我不开发，A不开发，我开发；④无论A是否开发，我不开发。若将B的信息集从左到右排列，上述策略可写成：{开发，开发}，{开发，不开发}，{不开发，开发}，{不开发，不开发}（如下表）。从策略式表述中，该博弈有三个纯策略纳什均衡：（开发，{不开发，开发}），（开发，{不开发，不开发}）和（不开发，{开发，开发}）。在每一个均衡，给定对方的策略，自己的策略是最优的。前两个均衡的结果是（A开发，B不开发）；第三个均衡的结果是（A不开发，B开发）。注意：为什么第三列第二行不是纳什均衡？在扩展式表述博弈中，所有n个参与人的一个纯策略组合