博弈论地基本概念.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论地基本概念

博弈论的基本概念 博弈论是研究两人或多人谋略和决策的理论。 博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。 策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用si表示参与者i的一个特定策略,用Si表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,sn)称为一个策略组合。 收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用ui表示参与者i的收益,它是策略组合的函数。 均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 例一 囚徒困境 两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。 囚徒一沉默坦白沉默坦白-1 囚徒一 沉默 坦白 沉默 坦白 -1,-1 -9,0 0,-9 -6,-6 例二 海滩占位 甲、乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格,相同的质量向均匀散布在海滩上的众多游客销售冷饮。既然是做生意,目的总是多赚钱,甲乙两人有时在同一地点做同样的生意,竞争是难免的,这两个摊贩应该怎样安排自己的摊位,才能相安无事的做自己的生意?(假定游客总是到据自己最近的摊位购买冷饮)。 例三 智猪争食 猪圈里有一头打猪和一头小猪。里面有一个猪食槽,槽的对面装有控制开关。只要去拱开关,就会有一次6个单位的饲料流进槽里。如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪去拱,那么等到它跑回来时,大猪已把饲料吃光了;如果大猪去拱,等它回来时可以吃到1个单位的饲料;如果他们一起去拱,在一起跑回来,那么大猪可以抢到4个单位的饲料,小猪也能吃到2个单位的饲料。假定每拱一次开关需要消耗0.5个单位的饲料能量。它们长期一起进食,上面所说的情况两只猪都知道。它们应该如何选择? 拱不拱拱0,06 拱 不拱 拱 0,0 6,-0.5 0.5,5 3.5,1.5 大猪 小猪 不拱 完全信息静态博弈 静态博弈:静态博弈指的是博弈的参与者同时选择各自的行动,即便是选择行动有先后的话,后行动者也不知道先行动者所采取的行动。 博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合i? N;(2)每个参与者的策略空间Si;(3)每个参与者的收益函数ui。 定义:在一个有n个参与者的博弈中,参与者的策略空间S1,S2,…,Sn,收益函数为u1,u2,…,un,称G={S1,S2,…,Sn;u1,u2,…,un}为此博弈的一个标准表述。 定义:如果对任一si’ ? Si,si’ 1 si*, 不等式ui(s1,…,si-1, si*, si+1,…,sn) ui(s1,…,si-1, si’ ,si+1,…,sn)对所有的策略组合(s1,…,si-1, si+1,…,sn)都成立,那么 si*称为参与者i的严格占优策略。 定义:在博弈的标准表述中,如果对所有的参与者i ?N, si* 是i的严格占优策略,那么策略组合s*=(s1*, …,sn*)称为严格占优策略均衡。 定义:在标准表述的博弈中,设si’和si’’

文档评论(0)

jyf123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6153235235000003

1亿VIP精品文档

相关文档