- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对局理论导论.doc
对局理论导论
1.1 对局及其解
博弈论,又称对策论,对局理论,对应的英文为game theory,是研究对局的一种数学理论。本课程非数学课,只是介绍对局理论在经济学分析中的应用而已。
博弈论研究在对抗的情况下,如何获得最优策略的一种数学方法,也可以说是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。即当一个主体如一个人或者一个企业的选择受到其他人、其他企业的影响,而且反过来影响到其他人、其他企业选择时的决策问题。人们之间决策行为的相互影响的例子很多,如寡头市场上,企业选择他们的价格和产量;国与国之间的关系,朝核问题六方会谈,伊核问题,叙利亚问题,钓鱼岛问题;战争双方的战法选择等等。可见,对局理论的应用相当的广泛。
Jean Tirole:对局理论广泛而深入地改变了经济学家的思维方式。
管理研究与经济学分析的关系。
什么是对局呢?
当多个决策主体的行为发生直接相互作用的时候,就构成了对局。例如“囚徒困境”,顶杠锤“剪刀石头布”,等等。
非合作策略对局(GAME)的基本特性:
每一个局中人独立地进行信息获取,独立地进行价值判断,独立地进行决策,每一个人的决策的后果取决于参与对局的所有人的决策。
合作对局中有一部分局中人之间有一起行动的强制性协议。
“囚徒困境”对局(塔克1,1950s):两个囚犯在警察的询问下和法庭的审判中,应该选择认罪还是选择拒绝认罪(坦白从宽,牢底坐穿;抗拒从严,回家过年)。每个囚犯有两种策略/行动选择:坦白或抵赖。其支付表(payoff table)如表1所示。
表1 “囚徒困境”对局的支付表
囚犯 Ⅱ
坦白T2 抵赖D2
囚犯Ⅰ 坦白T1 -8,-8 0,-10
抵赖D1 -10,0 -1,-1
对于囚犯Ⅰ来说(对称地也可以适用于描述囚犯Ⅱ),
当囚犯Ⅱ选择坦白时,如果他抵赖支付为-10;如果他坦白支付为-8,
当囚犯Ⅱ选择抵赖时,如果他抵赖支付为-1;如果他坦白支付为0。
对局的解又如何定义、如何求解呢?
在一般的管理研究中,面对的一个决策者,只需要求出其目标函数极大化的方案即可(学过运筹学??决策分析理论、管理科学等很容易理解这一点)。
但是现在不同了!
现在有多个决策者,一人最优不是优,百花齐放春满园。自然地想到大家(对局所有参与者)都同时实现目标函数极大化的情形。如果存在这样的情形,那就是该对局的解。
回到“囚徒困境”,假设两个“囚徒”都是理性的,即均追求自己效用的极大化。
对于“囚徒1”来说,当“囚徒2”坦白时的最优决策是坦白,当“囚徒2”抵赖时最优策略仍然是坦白。即不论“囚徒2”的决策是什么,抵赖都是自己的劣战略,坦白才是自己的占优策略:坦白均优于抵赖。
同理可得,坦白也是“囚徒2”的占优策略,抵赖是其劣战略。
由此得到双方同时选择自己的占优策略,即(坦白,坦白)构成了该对局的一个解,即占优策略均衡。
你也在可以在以后验证这也是纳什均衡。后者的空间大于前者。
这就是由于双方作为理性个体的对局结果。从个人理性来看显然选择坦白是较优的。从集体理性来看则是选择同时抵赖是最优的。法官。
扩展刚才的过程,其中最重要的关键步骤是剔除了局中人的劣战略,当局中人有多个战略时,如果能够不断地剔除其劣战略,即相对于其他战略结局都不好的战略,这种剔除过程在局中人之间逐一不断交互地进行,直到最后成为某一个局中人的决策问题,即不再构成对局,此时所有局中人最后形成的最优策略组合就是所谓的“重复剔除劣战略的对局均衡”。
很显然,占优策略均衡是一种重复剔除劣战略的对局均衡,反过来则不一定。
现实情况是,能够求得上述两种均衡的对局太少了!
有必要寻求更为广泛的对局解!
纳什的贡献就是为人类文明贡献了纳什均衡这样一种对局的解!
他个人为此付出了惨痛的代价,请观看电影“The Beautiful Mind”。
1.2对局理论的基本概念及其表示方式
对局理论的基本概念包括参与人、行动、信息、策略、效用、结果和均衡,其中,参与人、策略、效用是描述一个对局所需要的最少的要素,而行动和信息是其“积木”。参与人的行动和结果通称为“对局规则”。对局分析的目的是使用对局规则预测均衡。
参与人: 对局参与者,通过选择行动,使自己的效用极大化。参与人可以是个人,也可以是团体,如企业、国家等。除一般意义上的参与人之外,为了分析的方便,将“自然”作为“虚拟参与人”来处理,用于描述对局中的客观不确定性。“自然”是指决定外生的随机变量的概率分布的机制。
行动: 参与人在对局的某个时点的决策变量。在n人对局中,n个人的行动的有序集a=(a1,...
文档评论(0)