二人有限对策浅析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二人有限对策浅析 摘要:对策论的应用随着社会的发展越来越受到重视,而正确的解决方法对对策论的应用有着决定性意义。文章从一些最基本的对策论知识着手,较为系统地介绍了应用最广泛的——二人有限对策模型及其解法,尤其是对二人有限零和对策及其解法的介绍从而使人们对于对策论的应用有了一个深入的了解。 关键词:对策论;最优策略;最优解 现代理由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。1. 对策论及其基本概念 我们将具有斗争或竞争性质的现象称作对策现象。 对策论(Game Theory)又称为博弈论,是研究对策现象的数学理论与方法的一门学科。属于运筹学(OR)的一个分支。它主要研究竞争的各方是否存在着最合理的行动方案和如何找到这个合理方案。也可以说对策论是关于利益冲突的一类数学模型。 在讨论开始时,我们先来熟悉对策模型的一些基本概念。 局中人(Player) 是指在一场竞争中有权决定自己行动方案的对策参与者。需要注意的是,局中人一定有决策权;局中人可以是个人也可以是集体,甚至可以是物;当大自然充当局中人时,认为它是按自然规律变化的。 策略(Strategy) 是指局中人在一场竞争或冲突中,一个可行的、自始自终通盘筹划的行动方案。一个局中人所有可能采取的策略总体称为该局中人的策略集合。在这里,策略不是指竞争过程中的某一步行动方案,而是指自始自终采取的一整套行动方案,即一个决策序列。 效用(Utility) 一场竞争或冲突结束以后,对每个局中人的最终结果,统称为得失或支付(pay off),即可以用数字或函数来表示每一局中人在货币、物质或是精神、心理上的得失。将这种衡量 “得失”的标准,认为是局中人对于竞争结果的价值观,称为效用。全体局中人的“得失或支付”相加总是等于零,该对策称为零和对策,否则称为非零和对策。 【定义1.1】称为对策(game),其中: N——局中人的集合,,n为局中人数目; ——第i个局中人的策略集,其元素为第i个局中人某一策略; S——结局集合,; ——第i个局中人对于结局集合S的支付或效用。 对策论的模型,充分体现了对策现象的三要素。因此可以根据这三个基本要素对各种对策进行分类。而本文介绍的二人有限对策论模型,是指一类具有二个局中人、且对策数目有限的模型。可以用表示。同时,可以根据其策略数目的不同将二人有限对策分为二人有限零和对策和二人有限非零和对策。文章将从这两个方面对二人有限对策进行分析。 2. 二人有限零和对策(矩阵对策)模型及其解法 二人有限零和对策( Finite Zero Sum Two-person Game)也叫矩阵对策(Matrix Game),是指只有两个人参加对策的局中人,每个局中人都只有有限个策略可供选择。在任一局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。 2.1 矩阵对策的数学模型 【定义2.1】在中,如果分别是局中人1、2,矩阵表示局中人1的赢得矩阵,则称G为矩阵对策(Matrix Game)。其中称为纯策略(pure strategy)。 A的元素表示局中人1取策略,局中人2取策略,结局为时,局中人1的效用值,此时局中人2的效用值为。 【例1】齐王赛马的故事 战国时期,齐王和大将田忌进行赛马,双方约定各出三匹马一对一分别赛一局,每胜一场赢一千金。诚然,在相同的等级中,齐王的马比田忌的要好,似乎田忌必输无疑。但田忌手下的谋士孙膑出了个主意,让田忌用下等马对付齐王的上等马(输),用中等马对齐王的下等马(胜),用上等马对付齐王的中等马(胜),结果反而净胜一千金。 从对策论的角度来看,“齐王赛马”是一个矩阵对策问题。齐王的赢得表如下: 齐 王 的 效 用 上 中 下 上 下 中 中 上 下 中 下 上 下 中 上 下 上 中 (上 中 下) 3 1 1 1 1 -1 (上 下 中) 1 3 1 1 -1 1 (中 上 下) 1 -1 3 1 1 1 (中 下 上) -1 1 1 3 1 1 (下 中 上) 1 1 -1 1 3 1 (下 上 中) 1 1 1 -1 1 3 于是,齐王的赢得矩阵可写成 那么,田忌的赢得矩阵为。 2.2 矩阵对策的求解 2.2.1 纯策略(即有鞍点的矩阵对策) 【定义2.2】(最优纯策略)设为一矩阵对策,其中,,,如果使成立。则称为对策G的值,称使上式成立的结局为G的鞍点(saddle point),或称为对策G在纯策中的解(或平衡局势),简称纯策略解,与分别称为局中人A、B的最优纯策

文档评论(0)

smdh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档