第八章 对策论.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章 对策论 【教学内容】 对策论的基本概念,纳什均衡,矩阵对策,二人的无限零和对策,有限的二人非零和对策,人合作型对策人合作型对策纳什均衡人合作型对策人合作型对策对策论)博奕论,对策论是研究具有斗争或竞争性质现象的数学理论和方法对策论的零星研究可上溯到18世模型和关于价格决策的伯特兰德模型则是古诺和伯特兰德分别于1838年和1883年提早在1912年,E.Zermelo用集合论的方法研究过下棋,他Borel在1921年,也用数学方法研究过下棋时的一些个别现象,并且的各学科纷 伴随着对策论的研究,经济科学的研究1944年诺依曼和摩根斯坦合薯从此,对策论的研究才系统化与公理1994年三位长期致力于论的理论和应用研究、实践的、海萨尼和塞尔顿共同获得 对策论来自于生活。简单的问题如游戏,决策者的策略对最终结果有着举足轻重的影响,但决策者的策略选择也要考虑其它策略者的策略选择,现实生活中一个坏的策略选择未必带来坏的结果(原因是他方选择了对自己不利,对前者有利的策略),对策论的研究中排除了对方犯错误的可能性,每个决策者都在考虑到他方的各种策略后,选择对自己最有利的策略。对策论解决的问题大的象经济生活中的经营决策、市场竞争,政治、军事活动中的竞选、谈判、联合和战争等,从这点来说对策论大有用武之地。 本章先介绍了对策论的基本概念,然后通过例子介绍了纳什均衡的概念及求解方法,重点介绍了二人零和对策(矩阵对策)与求解,接着介绍二人的无限零和对策、有限的二人非零和对策。最后介绍人合作型对策人合作型对策引言对策论博奕论,对策论是研究具有斗争或竞争性质现象的数学理论和方法在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为“齐王赛马”就是一个典型的对策论研究的例子齐王与田忌进行赛马双方约定:从各自的上、中、国各公司企业之间的争夺市场而进行的竞争在生产过程中,如果将成一方,将各种费用消耗、成本及损失等看成另一方,则生产过程也可具有竞争或对抗性质的行为称为对策行为.在这类行为中,参加斗争或竞争的各论传统经济学研究中忽略掉的 §1.1 对策的三要素 从前述可看出对策论是研究具有斗争或竞争性质现象的数学理论和方法。不同性质,可建立不同的对策模型。尽管对策模型的种类可以千差万别,但本质上都必须包含 个基本要素: 1.局中人局中人即在一个对策行为中,有权决定自己行动方案的对策参加者。通常用个局中人,则 1,2,3,…。一般要求一个对策 对策中关于局中人的概念是的。可以个人,还可人参赛,但只能两个局中人。需要的一点是,在对策中总是假定每一个局中人都是“理智的” 2.策略集 一局对策中,可供局中人选择的一个可行的方案称为一个策,都有自己的策略集。在齐王赛马的例子中,如果用 上,中,下 表示以上马、中马、下马依次参赛这样一 上,中,下 、 上,下,中 、 中,上,下 、 中,下,上 、 下,中,上 、 下,上,中 .赢得函数 支付函数 在一局对策中,各局中人所选定表示第个局中人的一个策略,则个局中人的策略组 就是一个局势。全体局势的集合可用各局中人策略集的笛卡尔积表示,即 当局势出现后,对策的结果也就确定了也就是说,对任一局势,局中人可以。显然是局势的函数,称之为第个局中人的赢得函数每个决策的有限集合,每个参与人集合和一个建立在组: 只要,就有。表示参与人认为优于。 §1.2 对策的分类 对策每个方面的特征都可以作为对策分类的依据。根据参与方的数 第二节 纳什均衡 纳什均衡是对策论中一个重要的概念。尤其在非合作对策分析中具有十分关Nash均衡正是体现这一基本原则。我们先来完全信息静态博弈。所谓完全信息静态博.1 纳什均衡 用表示一个对策,若一个对策中有个局中人,则每个局中人可选策略的表示;表示局中人的第个策略,其中 有限策略对策 ,也可取无限个值 无限策略对策 ;对策方的得益表示;是各对策方策略的多元函数,个局中人的对策常写成 定义8.2.1 在对策中,如果由各个对策方的各选中,任一对策方的策略,都的最佳策略,即 对任意都成立则称为一个纯策略纳什均衡例子是特别经典的每本教 例8.2.1 警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他1年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而8年徒刑;如果两人都坦5年监禁。 如果对此作以分析:局中人为两个囚徒,两个人都有两种策略(坦白、不坦白),两人的策略集共有四个元素。我们用-1、-5、-8分别表示被判刑的得益,用0表示被释放的得益,则可由下面的得益矩阵将此对策予以表示: 表8.2.1 策略 坦白 不坦白 策略 坦白 (-5,-5) (0,-8) 不坦白 (-8,0) (-1,-1) 对两个来讲,各自都有两种可选择的策略,0,最坏得益是一8。的唯一目标 每个选择自己的策略时,虽

文档评论(0)

seym + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档