网站大量收购独家精品文档,联系QQ:2885784924

第十一章 博弈论练习题2答案.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
111111111111111111 博弈论练习题(四 一、 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。二、 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提。三、 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡 如纯策略就不存在混合策略则一定会存在纳什均衡 它是通过概率来计算纳什均衡在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取; 此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五 答: 博弈重复次数有限,意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中,如果某一参与人选择了自己的占优战略,给其他参与人造成损失,则其他参与人不可能报复。所有的参与人都明白这一点,因而在最后一次阶段博弈中都会选择占优战略,换句话说,在给定最后阶段所有参与人都会选择占优战略的前提下,所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。由此从最后的阶段开始,逐个阶段进行推理,可以得出以下结论:在阶段博弈有唯一的纳什均衡时,有限次重复博弈的唯一子博弈精炼纳什均衡结果,是阶段博弈的纳什均衡重复。这就是说,每个阶段博弈出现的都是一次性博弈的均衡结果。 六 答:不一定。例如:无限次重复博弈的古诺博弈,此博弈是相同博弈重复无限次,当冷酷战略是整个博弈的纳什均衡时,当然也就是每个阶段的纳什均衡。此时,无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈,一是选择生产垄断产量的一半Q/2,另一是选择生产背叛产量时,冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。贴现因子较大说明未来的利益较大,对两厂商都有较大的吸引力,一般情况下,两厂商不会为了短期利益而背叛对方而失去较大的长远利益,即两厂商都有坚持冷酷战略的积极性。而当时,意味着冷酷战略不再是一个子博弈精炼纳什均衡。贴现因子较小说明未来的利益对两厂商都不具有吸引力,选择背叛才是两厂商的最优选择。这种条件下,博弈无限次重复也不能提高一次性博弈的得益。 七 答:“触发战略”是这样一种战略∶首先试探合作,如果对方合作,则给予奖励;如果对方不合作,则给以惩罚。在原博弈有多个纳什均衡的条件下,在重复博弈时,通过触发战略提高了双方的收益。首先,在第二次博弈时意味着该博弈结束,而均衡结果是原博弈的纳什均衡,双方都没有偏离的意愿;其次,第一次选的策略虽不是原博弈的纳什均衡,如果某一方偏离会增加收益,但这样会遭到对方第二次选另外的策略的惩罚而损失收益,使总得益减少。预见到这一点,只顾眼前不顾长远的偏离是得不偿失的事,因此双方会坚持选使总收益最大的策略。所以,触发战略构成的均衡都是子博弈精炼纳什均衡。 八、什么是冷酷战略?什么是针锋相

文档评论(0)

0520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档