- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 土木系统工程的理论基础 第四节 博弈论 博弈论 相互依存与理性行为 纳什均衡 3、矩阵对策 (3)矩阵对策的混合策略 由前面的讨论可知,对矩阵对策 来说,局中人Ⅰ有把握的至少赢得是 局中人Ⅱ有把握的至多损失是 一般,局中人Ⅰ的赢得值不会多于局中人Ⅱ的所失值,即总有 当 v1 = v2 时,矩阵对策G存在纯策略意义下的解, 然而,一般情形不总是如此,实际中出现的更多情形是 v1v2,这时,对策G不存在纯策略意义下的解。 例如,赢得矩阵为: 如果双方仍然各自根据从最不利情形中选取最有利结果的原则选择纯策略,应分别选取a2和b1。此时局中人Ⅰ将赢得5,比其预期赢得v1=4还多,原因就在于局中人Ⅱ选择了b1,使他的对手多得了原本不该得的赢得。故b1对局中人Ⅱ来说并不是最优的,因而他会考虑出b2。局中人Ⅰ亦会采取相应的办法,改出a1以使赢得为6,而局中人Ⅱ又可能仍取策略b1来对付局中人Ⅰ的策略a1。这样,局中人Ⅰ出a1或a2的可能性及局中人Ⅱ出b1或b2的可能性都不能排除。 定义:对给定的矩阵对策 G ={S1,S2;A} 其中 S1={?1, ?2…?m} S2={?1 , ?2… ?n} A=(aij)mn 把纯策略集合对应的概率向量 X=(x1, x2 … xm) 其中 xi ? 0 ?xi=1 和 Y=(y1 , y2 … yn) 其中 yj ? 0 ?yj=1 分别称为局中人Ⅰ和局中人Ⅱ的混合策略。 若只进行一次对策,混合策略可设想成局中人对各纯策略的偏爱程度。 如果局中人Ⅰ选取的混合策略为X=(x1, x2 … xm),局中人Ⅱ选取的混合策略为Y=(y1 , y2 … yn),则期望值 称为局中人Ⅰ期望赢得,而局势(X,Y)称为“混合局势”,局中人Ⅰ,Ⅱ的混合策略集合记为S1*, S2*。 这样得到的新对策记成 称G*为对策G的混合扩充。 纯策略是混合策略的特例。 * 对策行为 在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为,如下棋、打牌、体育比赛等。 还比如战争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对手。 在政治方面,国际间的谈判,各种政治力量之间的斗争,各国际集团之间的斗争等无一不具有斗争的性质。 在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的竞争等,举不胜举。 具有竞争或对抗性质的行为称为对策行为 1、博弈论的概念和演变 博弈论(Game Theory)又称对策论或竞赛论,是研究具有竞争或比赛性质的数学理论和方法,属于运筹学的一个分支,也是土木系统工程的理论基础之一。博弈论研究对抗的双方在竞争过程中是否存在自己制胜对方的最优策略,由于其处理问题的方法有着明显特色,所以正日益得到广泛应用。 对策论发展的历史并不长,但由于它研究的问题与政治、经济、军事活动乃至一般的日常生活等有着密切联系,所以日益引起广泛注意。 博弈论历史悠久,但直至20世纪20年代才引人“最优策略”的概念。4O年代以来,由于生产和战争的需要,特别是战争中兵力调动、兵种步署、监视对方、侦察活动等迫切要求战争指挥者拿出最好策略,用已有的条件去取得较大的胜利或较小的失败,于是对策论的数学模型很快就形成了。各参战国组织了大批科学家参加这项研究工作,1944年,这一工作被提高到一个新水平,冯·诺依曼和摩根斯顿出版了《对策论与经济行为》,从此,对策论的研究才演变为系统化的理论化。 20世纪50年代,纳什(Nash)建立了非合作博弈的“纳什均衡”理论,标志着博弈的新时代开始,是纳什在经济博弈论领域划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。 1994年纳什获得了诺贝尔经济学奖。他提出的著名的纳什均衡概念在非合作博弈理论中起着核心作用。 博弈论的典型例子之一:齐王赛马 战国时期,有一天齐王提出要与田忌赛马,双方约定从各自的上、中、下三个等级的马中各选一匹参赛,每匹马均只能参赛一次,每一次比赛双方各出一匹马,负者要付给胜者千金。已经知道,在同等级的马中,田忌的马不如齐王的马,而如果田忌的马比齐王的马高一等级,则田忌的马可取胜。当时,田忌手下的一个谋士给他出了个主意:每次比赛时先让齐王牵出他要参赛的马,然后来用下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。比赛结果,田忌二胜一负,夺得千金。由此看来,两个人各采取什么样的出马次序对胜负是至关重要的。 两个嫌犯受到指控,但除非至少一个招认,否则警方不能将二人判有罪。警察把二人分别带到不同的房间,告之后果: 如果二人均不坦白,将被判入狱一年。 如果双方均坦白,将被判入
文档评论(0)