网站大量收购独家精品文档,联系QQ:2885784924

第6章节_博弈论.pptVIP

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章节_博弈论

博 弈 论 博弈论( Game Theory ) 一、博弈论的产生及发展 博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。 一般认为,1944年美国数学家冯?诺依曼(John Von Neumann)和经济学家奥斯卡?摩根斯坦(Oskar Morgenstern)合著的《博弈论与经济行为》(The Game Theory and Economic Behavior) 一书的出版,标志着系统的博弈理论的形成。 该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨著的出版视为数理经济学确立的里程碑。 实际上,很多人把博弈论看成数学的一个分支,博弈论的重要代表人物——纳什(Nash)在1951年的一篇奠基性的文章就是发表在数学杂志上,而非经济学杂志上。 现代博弈论是在20世纪50——60年代发展起来的,到20世纪70年代,博弈论正式成为主流经济学。 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔藤和海萨尼。 二、博弈论的概念和实质 1、概念: 博弈论是研究决策主体的行为发生直接相互作用时的决策,以及这种决策的均衡问题。 研究人们在各种相互作用情况下如何行事。 2、实质:由于相互作用,每个人在决定采取什么行动时,必须考虑其他人对这种行动作出什么反应。 分析: 张三推理:我不知道李四怎么做。如果他保持沉默,我最好的策略是坦白,这样我就可以只是入狱1年,而不是8年;如果他坦白,我最好的策略仍然是坦白,这样我将在狱中待5年,而不是8年。因此,无论李四怎么做,我选择坦白会更好些。 李四也有相同的推理 结 果: 张三和李四都坦白了,两人都要在狱中呆5年。如果他们两人都保持沉默,他们的状况会更好些,只会因为偷窃罪而在狱中呆2年。但由于追求自己的利益最大,两个囚犯共同达到了使每人状况变坏的结果。 伊拉克总统推理: 如果伊朗这个狡猾的国家选择违背协议提高产量,那么,我国选择高产量策略可得400亿大于选择低产量的300亿;就算伊朗遵守协议维持低产量,同样我国选择高产量策略可得600亿而不是选择低产量的500亿。因此,无论伊朗选择怎么做,我国违背协议提高产量,情况会更好。高产量策略是伊拉克的上策(优势策略)。 对于伊朗的决策机构也会有同样的推理 所以,最后双方的最终选择是(高产量,高产量) 上策(dominant strategy),也称为优势策略,指的是这样一种策略:即不管对手采取什么样的策略,这种策略都是最好(最优)的。 当当局者选择的都是上策的时候,这种均衡就叫做上策均衡 在博弈论中,所谓的均衡是指一种稳定的结局,当这种结局出现的时候,所有的当局者都不想再改变他们所选择的策略 在上面的对局中,男生和女生都没有上策。实际上,他们的最优策略依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的选择。在这个对局中,同时出现了两个均衡状态,我们把这种均衡称为纳什均衡。 纳什均衡:指在对手的策略既定的情况下,各个对局者所选择的策略都是最好的 小结: 上策均衡与纳什均衡的关系 上策均衡是指:不管你选择什么样的策略,我所选择的是最好的;不管我选择什么样的策略,你所选择的是最好的 纳什均衡是指:给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的 不难看出,上策均衡是纳什均衡的一种特殊情况,但纳什均衡不一定是上策均衡 混合策略 小偷与守卫的博弈 混合策略博弈的几个原则 小偷与守卫的博弈 混合策略博弈的几个原则 策略组合不可能是单一的策略或者纯策略,而必须把不同的策略混合一起使用,这种博弈也称之为“混合策略” 博弈,所达到的均衡也称之为混合策略均衡。 第一,不能让对方事先知道自己可能采取的策略。 第二,必须采取随机选择的原则。 第三,选择策略的概率一定要使对方无机可乘。 动态博弈 重复博弈 序列博弈 重复博弈 对重复博奕的研究结果证明有一种最好的策略:只需将一个原则贯穿始终,即“以牙还牙”(Tit-for-tat)。 以牙还牙策略的获胜有一个十分重要的条件,即博弈是无限次重复的。 序列博弈 对局者选择策略有时间先后的

您可能关注的文档

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档