网站大量收购独家精品文档,联系QQ:2885784924

第节 博弈论丶博弈论的应用.docVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第节 博弈论丶博弈论的应用.doc

第12节 博弈论丶博弈论的应用 ??2 列参与人 ??2 3.(判断题)纳什均衡就是指不管在什么情况下,博弈的局中人都不再改变自己策略时的状态。 ( ) 分析:在这里要注意区别纳什均衡和占优策略均衡。 占优策略均衡就是指博弈中一个参与人的最优策略不依赖于其他人的策略选择,不论其他人选择什么策略,他的最优策略是唯一的。占优策略均衡是稳定的,也就是说不管在什么情况下,拥有占优策略均衡的参与者一定不会改变自己的策略。 纳什均衡指的是如果其他参与人不改变自己的策略,任何一个参与人都不会改变自己策略的均衡状态。前提条件是其他参与人不改变策略。但如果其他参与人一旦改变策略,那么纳什均衡也有可能随之而改变,当然也有可能不会改变。换句话就是说,纳什均衡是指这样一种策略组合,在给定别人策略选择的情况下,没有任何单个参与人有积极性选择其他策略。此时的纳什均衡并一定是稳定的。即纳什均衡的存在并不一定表示纳什均衡的稳定性。比如性别战就有两个不稳定的纯纳什均衡解。 4.(判断题)纳什定理告诉我们纳什均衡解存在且稳定。( ) 分析:纳什定理即指纳什均衡存在性定理,指如果一个对策的参与人是有限的,并且每个参与人只有有限的策略,则该对策至少存在一个纳什均衡。但该定理没有指出解是否唯一,一个对策可能存在多个纳什均衡;也没有指出解是否稳定。而且,很多情况下,纳什均衡解都是不稳定的。如性别战中的均衡解就是两个不稳定的纯纳什均衡解。 5.(上财07年选择题)下列博弈中的混合策略均衡是( )。 A.1采取A的概率是3/7,采取B的概率是4/7;2采取U的概率是3/7,采取D的概率是4/7 B.1采取A的概率是4/7,采取B的概率是3/7;2采取U的概率是4/7,采取D的概率是3/7 C.1采取A的概率是4/7,采取B的概率是3/7;2采取U的概率是3/7,采取D的概率是4/7 D.1采取A的概率是1/2,采取B的概率是1/2;2采取U的概率是1/2,采取D的概率是1/2 6,4 0,0 B 0,0 8,3 A 1 D U 2 【分析】 首先要明确什么是混合策略均衡,参与人选择混合策略就是选择一个概率分布,然后按照这个分布给出的概率来选择各个纯策略。混合策略是用概率分布x来表示的,混合策略的变化完全反映为概率分布x的变化。 在本题中,设1选A概率为p,2选U概率为q,则根据1选A,B无差异,2选U,D 无差异,列出等式 对1来说 8×q+0×(1-q)=0×q+6×(1-q) 对2来说 3×p+0×(1-p)=0×p+4×(1-p) 解出,则得p=4/7,q=3/7,所以选C。 6.某对策中甲乙双方各有三个策略,其相应的支付矩阵如下图所示: 问: (1)甲会不会采用策略A,为什么? (2)请剔除上述支付矩阵里的占劣策略。 (3)在被简化了的对策里,有没有均衡?均衡是什么?它是不是原对策的均衡?试说明。 D 9F E A C B 乙 甲 2,5 4,8 3,7 6,4 2,7 4,2 1,2 3,5 3,7 解析:(1)在这里要先理解什么是占劣策略。如果一个策略的每一种结果都比另一个策略的每一种结果差,那么该策略就叫做占劣策略。在本题中,很明显,策略A是甲的占劣策略。因为无论乙选择什么策略,甲选择C策略的收益都会大于选择A策略的收益。所以甲始终不会选择A策略。 (2)如图所示,对于甲来说,A是C的占劣策略,所以我们先剔除A,即在甲的A策略上划一条线以示剔除。在剩下的支付矩阵中我们又发现乙的策略D和F均劣于策略E,所以D和F是乙的占劣策略。我们进而划线把这两个策略剔除。 (3)通过上面第二问,我们采用剔除占劣策略的方式,在最后被简化的对策中,均衡解为(C,E)。 当然,大家也可以用传统的划线法求原博弈的均衡,如下图所示。显然,同样均衡解为(C,E)。 2,5 4,8 3,7 6,4 2,7 4,2 1,2 3,5 3,7 D F E A C B 乙 甲 2,5 4,8 3,7 6,4 2,7 4,2 1,2 3,5 3,7 L R M U D M 乙 甲 7.(上财07年选择)考虑一个囚徒困境的重复博弈,下列哪种情况将增加出现合作结果的可能性?( ) A.参与人对未来收益的评价远低于对现期收益的评价 B.参与人之间的博弈是频繁发生的 C.欺骗不容易被发现 D.从一次性欺骗中得到的收益比欺骗的成本更大 【解析】B一个囚徒困境的重复博弈,是博弈论中常举的例子,也是常考的知识点。当对策的重复次数为无限时,局中人在每一个阶段都知道对策至少还要重复一次以上,因而合作大有前景,长期利益在望。在这种无限次重复的囚犯对策中,每个人的策略都是一个函数序列,它表明每个局中人在每个阶段是选择合作还是选择背叛,都是作为此阶段之前对策历史的函数。

您可能关注的文档

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档