第九课博弈论.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九课博弈论

第九章 博弈论 例题讲解: 例1 名词解释: (1)博弈论:博弈论(game theory),又译为对策论,就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。一般而言,博弈表现为两个或两个以上具有利害冲突的参与人或当事人处于一种互不相容的状态中,一方的行动取决于对方的行动,每个参与人的收益都取决于所有参与人的行动。当所有参与人都选择了自己的决策时,博弈的结果就暂时确定下来。 (2)策略(strategies),又称战略,是指参与人选择其行为的规制,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。 (3)收益(payoff),又称支付,是指参与人从博弈中获得的利益水平,它是所有参与人策略或行为的函数,是每个参与人真正关心的东西,如消费者最终所获得的效用、厂商最终所获得的利润。 (4)纳什均衡: 纳什均衡指这样一种策略组合,在这一策略组合中,每一个博弈方都确信,在给定竞争对手策略的情况下,他选择了最好的策略。是由所有参与者的最优策略所组成的一个策略组合,也即,给定其他人的策略,任何个人都没有积极性去选择其它策略,从而这个均衡没有人有积极性去打破。 (5)占优均衡:指这样一种策略组合,在这一策略组合中,各博弈方采取的策略都是占优策略或上策。 (6)混合策略:是指在博弈中,博弈方在决策内容不确定情况下的策略,即以一定概率分布来选择某些策略。混合策略有两个决策原则:一是参与人互相不让对方知道或猜到自己的选择,因此必须在决策时利用随机性来选择策略,避免任何有规律性的选择;二是参与人选择每种策略的概率必须要恰好使对方无机可乘,即让对方无法有针对性选择某一策略而在博弈中占上风。 例2.求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 L R T 2,1 0,2 B 1,2 3,0 解:首先该博弈没有纯策略纳什均衡。设博弈方1选择纯策略T和B的概率分别为t1和t2, 根据混合策略纳什均衡的含义有: 同样地,设博弈方2选择纯策略L和R的概率分别为m1和m2,根据混合策略纳什均衡的含义有: 该博弈惟一的混合策略纳什均衡是:博弈方1以(2/3,1/3)的概率随机选择T和B。 博弈方2以(3/4,1/4)的概率随机选择L和R。 例3 考虑如下贝叶斯博弈:(1)自然决定支付矩阵如表3A.1(a)或(b),概率分别为t和1-t;(2)参与人1知道了自然选择了(a)还是(b),但参与人2不知道;(3)参与人1和参与人2同时行动(参与人1选择T或B,参与人2选择L或R)。给出这个博弈的扩展式表述(博弈树)并求纯战略贝叶斯纳什均衡。 L R T 0,0 0,0 B 0,0 2,2 L R T 1,1 0,0 B 0,0 0,0 解答:这个博弈的扩展式表述(博弈树)如下(4分): 参与人2选择L的期望得益为t×1=t,参与人2选择R的期望得益为(1-t)×2=2-2t,由t>2-2t,得t>2/3;另外,如自然选择了(a),则T是参与人1的占优战略,自然选择了(b),则B是参与人1的占优战略。因此,纯战略贝叶斯纳什均衡为如下战略组合: 参与人1的战略:若自然选择了(a),则参与人1选择T,否则,则参与人1选择B。 参与人2的战略:若自然选择(a)的概率t>2/3,则参与人2选择L;若t<2/3,则参与人2选择R;若t=2/3,则参与人2选择L或R无差异。(6分) 单元练习题 一、判断题 “囚徒困境” 博弈中两个囚徒之所以处于困境,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。( ) 凡是博弈方的行为、选择有先后次序的一定是动态博弈。( ) 合作博弈就是博弈方采取相互合作态度的博弈。( ) 纳什均衡是任一博弈方单独改变策略都只能得到最小得益的策略组合。( ) 如果一个博弈有两个纯策略纳什均衡,则一定还存在一个混合策略纳什均衡。( ) 在动态博弈中,因为后行为的博弈方可以先观察对方行为后再选择,因此总是有利的。( ) 逆推归纳法能够排除所有的不可置信的威胁。( ) 如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡, 该策略组合就是这个动态博弈的子博弈完美纳什均衡。( ) 有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。( ) 无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。( ) 如果博弈重复无限次,而得益的时间贴现率充分接近于1,那么任何个体理性的可实现得益都可以 作为子博弈完美纳什均衡的结果出现。( ) 完全但不完美信息动态博弈中各博弈方都不清楚博弈的进程,但清楚博弈的得益。( ) 完全信息静态博弈的混合策略均衡是不完全信息博弈的纯策略贝叶斯均衡的极限。(

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档