网站大量收购独家精品文档,联系QQ:2885784924

扩展式博弈与纳什均衡.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
扩展式博弈与纳什均衡.ppt

在静态博弈中,所有参与人同时行动(或行动虽有先后,但没有人在自己行动之前观测到别人的行动);在动态博弈中,参与人的行动有先后顺序,且后行动者在行动之前能观测到先行动者的行动。 通常用扩展式表述分析动态博弈。博弈的扩展式表述“扩展”的主要是参与人的策略空间。策略式表述简单地给出参与人有些什么策略可供选择,而扩展式博弈要给出每个策略的动态描述:谁在什么时候行动,每次行动有些什么具体行动可供选择,以及知道些什么。 博弈的扩展式表述包括以下要素: (1)参与人集合:i=1,2,…n ;此外,将用N表示虚拟参与人“自然”。 (2)参与人的行动顺序:谁在什么时候行动。 (3)参与人的行动空间:每次行动时,参与人有些什么选择。 (4)参与人的信息集:每次行动时,参与人知道些什么。 (5)参与人的支付函数:行动结束后,参与人得到些什么(支付是所有行动的函数)。 (6)外生事件(即自然的选择)的概率分布。 如同两人有限策略博弈的策略式表述可用博弈矩阵表述一样,n人有限策略博弈的扩展式表述可用博弈树表示。 以房地产开发为例。假定该博弈的行动顺序如下:(1)开发商A先行动,选开发或不开发;(2)在A决策后,自然选择市场需求的大小;(3)开发商B在观测到A的决策和市场需求后,决定开发或不开发。其博弈树如下表。 博弈树给出了有限博弈的几乎所有信息,其基本构建包括: 1.结(nodes):包括决策结(上面三个)和终点结(B的四个策结)。前者是参与人采取行动的时点,后者是博弈行动路径的终点。此例中,决策结包括1个空心圆和6个实心圆,终点结包括对应8个支付向量的点。 2.枝( branches ):枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。如A有两个选择,用“开发”和“不开发”两个枝表示。 3.信息集(information sets)。博弈树上的所有决策结分割成不同的信息集。每个信息集是决策结集合的一个子集,该子集满足下列条件:(1)每个决策结都是同一参与人的决策结;(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。引入信息集的目的在于描述:当一个参与人要作出决策时,他可能并不知道之前发生的所有事件。 情形1:图8-1 中,假定B是在知道A和自然的选择后进行决策,此时,博弈树的7个决策结分割成7个信息集(每个信息集只包含一个决策结),意味着所有参与人在决策时准确地知道自己处于哪一个决策结。 情形2:假定行动顺序如前,但B在决策时并不确切地知道自然的选择。此时,B的信息集由原来的4个变成2个,2个信息集分别对应着B的两个不同决策:若A开发,自己是否开发;若A不开发,B是否开发。用虚线将属于同一信息集的两个决策结连接起来(图8-2)。 情形3:B知道自然的选择,但不知道A的选择(如B和A同时决策)。此时,B也有两个信息集,每个信息集包含两个决策结:两处信息集分别对应两种不同的决策:需求大是否开发和需求小是否开发(图8-3)。 情形4:B知道N的选择但不知道A的选择,A不知道N的选择(图8-4)。 情形5:A既不知道N的选择也不知道B的选择,但B知道N的选择(图8-5)。 一个信息集可能包括多个决策结,也可能只包括一个决策结,后者叫做单结信息集。若博弈树的所有信息都是单结的,该博弈称为完美信息博弈,它意味着博弈中没有任何两个参与人同时行动,且所有后行动者能确切地知道前行动者选择了什么行动,所有参与人观测到自然的行动。在博弈树上,完美信息意味着没有任何两个决策结是用虚线连起来的。 另外,扩展式表述也可用来描述静态博弈。试写出囚徒困境博弈的扩展式表述。 从扩展式表述构造策略式表述。以房地产开发博弈为例。假定博弈开始之前自然就选择了“低需求”,且已成为共同信息;A先决策,B在观测到A的选择后再决策。则博弈的扩展式表述如下图(8-6)。 注意:A只有一个信息集,两个可选择的行动,因而A的行动(策略)空间为SA=(开发,不开发)。但B有两个信息集,四个纯策略,即①不论A是否开发,我开发;②A开发,我开发,A不开发,我不开发;③A开发,我不开发,A不开发,我开发;④无论A是否开发,我不开发。若将B的信息集从左到右排列,上述策略可写成:{开发,开发},{开发,不开发},{不开发,开发},{不开发,不开发}(如下表)。 从策略式表述中,该博弈有三个纯策略纳什均衡:(开发,{不开发,开发}),(开发,{不开发,不开发})和(不开发,{开发,开发})。在每一个均衡,给定对方的策略,自己的策略是最优的。前两个均衡的结果是(A开发,B不开发);第三个均衡的结果是(A不开发,B开发)。注意:为什么第三列第二行不是纳什均衡? 在扩展式表述博弈中,所有n个参与人的一个纯策略组合

文档评论(0)

光光文挡 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档