经济博弈论考试复习.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
经济博弈论考试复习 一、 1.什么是博弈论? “博弈论”译自英文“Game Theory”,直译就是“游戏理论”。是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。 博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。 2.什么是纳什均衡? 在博弈G=﹛,…,;,…, ﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(*,…, *)中,任一博弈方i的策略*,都是对其余博弈方策略组合(*,…,*, *,*,… *)的最佳对策,也即(*,…,*, *,*,… *)》(*,…,*, *,*,… *)对任意?都成立,则称(*,…, *)为G的一个“纳什均衡”。 (假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己利益最大化。所有局中人策略构成一个策略 组合就是纳什均衡。这种策略组合由所有参与人最优策略组成,即在给定别人策略的情况下,没有人有足够理由打破这种均衡。) 3.什么是囚徒困境? 囚徒困境的基本模型是这样的:警察抓住了两个合伙犯罪的罪犯。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们窜供或结成攻守同盟:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白这从轻处理,立即释放,而另一人则将重判八年徒刑;如果两人同时坦白认罪,他们将各被判五年监禁。 囚徒1坦白 不坦白(囚徒2) 囚徒1 坦白-5,-5 坦白 0,-8 不坦白-8, 0 不坦白 -1,-1 双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。由于这两个囚徒不能串通,个人都追求自己的最大利益而不会顾及同伙的利益,又不敢相信对方,以此只能实现他们都不理想的结果。该博弈揭示了个体理性与团体立项之间的矛盾——从个体理性出发的行为往往不能实现团体的最大利益,最终也不能真正实现个体的最大利益,甚至会得到相当差的结果。 二、 1.什么是完全信息静态博弈? 完全信息静态博弈是指各博弈方同时决策,且所有的博弈方对各方得益都了解的博弈。完全信息是指信息的充分性、对称性和透明性,静态是指同时决策,没有时间的差别。 2.如何求解纳什均衡? 求解纳什均衡的4种方法: ①离散、有限策略博弈:划线法 ②连续、无限策略博弈:反映函数法 ③零和博弈:最大最小法 ④循环相克博弈:混合战略(无差异原则) (1)离散有限——划线法 通过在每个博弈方对其他博弈方每个策略或策略组合的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”。 例:囚徒的困境博弈 囚徒1坦白 不坦白(囚徒2) 囚徒1 坦白-5,-5 坦白 0,-8 不坦白-8, 0 不坦白 -1,-1 可以看出,只有策略组合(坦白,坦白)对应的得益系数(-5,-5)下面都划有短线,意味着只有这个策略满足双方的策略相互使对对方策略的最佳对策。就是博弈的结果。 划线法一策略之间的相对优劣为基础,在分析用得益矩阵表示的博弈问题时十分有普遍适用性。但事实上,也有许多博弈根本不存在确定性的结果,无法用这种方法。 (2)连续无限——函数法(求导,建立拉格朗日方程) 反应函数法: 对一个一般的博弈,只要是得益是策略的多元连续函数,我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数,也就是反应函数,而解出的各个博弈方反应函数的交点就是纳什均衡。利用反应函数求博弈的纳什均衡的方法称为“反应函数法” 设:Ux=Ux(x,y) Uy=Uy(x,y) x,y,Ux,Uy连续,Ux,Uy二阶可微并且 0, 0, 则求解反映函数: =0 =0。其解即为Nash均衡 例:养羊博弈模型(P67) 局限性:1)对于不连续的得益函数无法用先求导数找出各个博弈方的反应函数的方法求纳什均衡,所以无法发挥作用。 2)并不能保证各博弈方的反应函数有交点,特别是唯一的交点。 (3)零和博弈 1)有限离散策略——最大最小值法: X给出一个策略ax’,则y会给出一个行动ay’,使Ux(ax’,ay’)=minUx(ax,ay),而x要选择一个ax*,使Ux最大,Ux(ax*,ay*)=max minUx(ax,ay)=min maxUx(ax*,ay*). y的一个策略ay,x却会选一个ax’使Ux最大,即Ux(ax’,ay

文档评论(0)

zhuliyan1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档