网站大量收购闲置独家精品文档,联系QQ:2885784924

王则柯-博弈论教程(四版)7第五章 同时博弈与序贯博弈.pptxVIP

王则柯-博弈论教程(四版)7第五章 同时博弈与序贯博弈.pptx

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章 同时博弈与序贯博弈;5-1 正规型表示与展开型表示 5-2 同时决策与序贯决策的混合博弈 5-3 树型博弈的子博弈 5-4 子博弈精炼纳什均衡 5-5 完美博弈的库恩定理 5-6 连续支付情形的序贯博弈;5-1 正规型表示与展开型表示;把首先行动的局中人放在行局中人的位置,后行动的局中人放在列局中人的位置。 垄断者有不止一个纯策略可以导致相同的博弈结果。;步骤: 首先确定好可供每个局中人选择的纯策略的总数目,从而把表格的大小确定下来,然后在每个策略组合所对应的格子中,按照约定的规格填入相应的支付向量。;2.矩阵表示转化为树型表示 问题:树型如何能够表达出局中人同时进行博弈的情况?;信息集;信息集 是决策结集合的一个子集,满足: 该子集中的每个决策结都属于同一个人 此参与人只知道博弈进入了该子集的某个决策结,但是不知道究竟是哪一个结。 引入信息集的目的是为了描述参与人对自己要决策之前的博弈历史的了解程度。;举例:房地产开发 如果参与人B在轮到自己决策时不知道自然选择是什么,因此不能确切的知道自己处于哪个决策结上。;;注意;同集同注:就是从同一个信息集的各个决策节点出发的策略选择,不仅数目相同,而且名称相同;当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史是清楚的,他清楚博弈具体走到了他的这个决策节点而不是别的决策节点。 当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弃具体走到了他的这个信息集里面的哪个决策节点。 ;完美和不完美;完美信息博弈的定义;例子;信息集与三人罢工博弈;纯策略纳什均衡 关于纯策略纳什均衡的举例 房地产开发商的例子;序贯决策博弈的混合策略纳什均衡 行为策略(Behavior Strategies) 参与人在每一个信息集上随机的选择行动 一个行为策略规定了对应每一个信息集的行动集合上的概率分布,且不同信息集上的概率分布是独立的;序贯决策博弈的纳什均衡;序贯决策博弈的纳什均衡;序贯决策博弈的纳什均衡;序贯决策博弈的纳什均衡;5-2 同时决策与序贯决策的混合博弈;例子;假定公???的研发投入只有低预算和高预算两种选择。低预算的结果是新产品只是旧产品的部分改良,而高预算的结果则是推出一个完全不同于旧产品而且质量高很多的全新产品。低预算策略用“小”或者“小投人”表示,高预算策略用“大”或者“大投入”表示。 假定在看到对手的新产品后的唯一决策问题就是对自己的新产品进行定价,定价只有“高”和“低”两种选择。 两阶段同时博弈的序贯结构;研发预算和定价博弈的矩阵型表述;;;研发预算和定价博弈的展开表述 每家公司各有32个纯策略。 结果只有16个。 ;5-3 树型博弈的子博弈;支和棱;子博弈;;注意;一共有几个子博弈?;请判断如下博弈有几个子博弈;5-4 子博弈精炼纳什均衡;子博弈精炼纳什均衡;子博弈精练纳什均衡本身也是纳什均衡,但却是比纳什均衡更强的均衡概念。 利用博弈树考察一个纳什均衡的时,只要局限于某一个子博弈上它不再是纳什均衡,所考察的纳什均衡就不是子博弈精炼纳什均衡。; 均衡路径: 一个特定的纳什均衡规定了博弈树上唯一的一条路径,这条路径就是均衡路径,其他路径是非均衡路径。 子博弈精炼纳什均衡不仅在均衡路径上最优,在非均衡路径上也是最优的。;(足球,{足球,足球}) 局限在根前断开的那支子树所标示的子博弈上,指向(-1,-1)的策略选择有单独偏离的激励,用弯曲箭头表示箭尾的策略成分有向箭头的方向偏离的激励(偏离方向的箭头标示法)。 如果一个策略组合的某个策略成分有偏离的激励,可以说这个策略组合缺乏局部稳定性。;子博弈精炼纳什均衡,应该是经得起每个子博弈均衡检验的纳什均衡。 包含不可信威胁的纳什均衡,不是子博弈精炼的纳什均衡。; 无论从全局看还是从每个局部看,都符合稳定性的要求,符合最优性的要求,是博弈的子博弈精炼的纳什均衡。;威胁和可信性;;课堂练习;5-5 完美博弈的库恩定理;逆向归纳法 应用于有限完美信息博弈 思想:从最后一个决策结,即最末梢的子博弈开始,寻找该据测结上参与人的最优选择;然后,退到上一层的决策结,寻找其参与者的最优选择;如此类推,直到初始结,即最高层次的子博弈。 是重复剔除劣战略在展开型博弈上的推广。;逆向归纳法——以两阶段为例 第一阶段参与人1行动,第二阶段参与人2行动,参与人2行动时可以观测到参与人1的行动 用逆向归纳法,从参与人2开始: 参与人1在第一阶段的选择为 参与人2面临的问题为 则参与人2的反应函数;逆向归纳法——以两阶段为例 返回到第一步,参与人1的选择 参与人1在选择行动时已预测到参与人2在第二阶段的反应函数 参与人1面临的问

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档