网站大量收购闲置独家精品文档,联系QQ:2885784924

第十二章对策论(运筹学讲义)课件.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
§1 对策论的例子 §2 矩阵对策论的基本概念 §3 矩阵对策的最优纯策略 §4 矩阵对策的混合策略 §5 其他类型的对策 对策论或博弈论(Game Theory) 是研究具有对抗和竞争性行为问题的数学理论与方法。是运筹学的重要分支学科 经济学领域一般称博弈论,是经济学领域近几十年发展起来一门新兴学科 对策问题举例 例1 猜单和猜双的博弈。两个人同时出一个指头或两个指头,如果两人出的指头相同,则局中人1从局中人2处赢得五元;如果出的不一样,局中人1就要支付给局中人2五元。两个对手都可以采取两个策略:出一个手指和出两个手指,下表是局中人1的赢得矩阵(二指莫拉问题) 例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。警察告诉他们:如果两人都坦白,各判刑8年;如果两人都抵赖,由于证据不充分,两人将各判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯都有两种策略:坦白或抵赖。可以用一个矩阵表示两个嫌疑犯的策略的损益 例3 田忌与齐王赛马 “齐王赛马”齐王在各局势中的益损值表(单位:千金) §1 对策论的基本概念 对策模型的三个基本要素: 1.局中人(Players):参与对抗的各方; 2.策略集(Strategices):局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集 3.一局势对策的益损值:局中人各自使用一个对策就形成了一个局势,一个局势决定了各局中人的对策结果(量化)称为该局势对策的益损值。 赢得函数(payoff function):定义在局势上,取值为相应益损值的函数 4. 纳什均衡:纳什均衡指所有局中人最优策略组成的一种局势,既在给定其他局中人策略的情况下,没有任何局中人有积极性去选择其他策略 对策的分类 对策 二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。 通常将矩阵对策记为: G = {S1, S2, A} 局中人甲的策略集: 局中人乙的策略集: 甲的赢得矩阵: 其中:齐王的策略集: S1={ ?1, ?2, ?3, ?4, ?5, ?6 }, 田忌的策略集: S2={ ?1, ?2, ?3, ?4, ?5, ?6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3 在如此反复对策的过程中,各局中人如果不想冒险,就应该考虑从自身可能出现的最坏情况下着眼,去选择一种尽可能好的结果,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。这就是所谓“理智行为”。称为最小最大准则,按照这个各方均避免冒险的观念,就形成如下的推演过程。 矩阵A中每行的最小元素分别为1,-3,-5。 在这些最少赢得中最好的结果是1,故局中人Ⅰ会采取策略?1,无论对手采取何策略,局中人Ⅰ至少得1分。对于局中人Ⅱ,{?1,?2,?3}可能带来的最少赢得,即A中每列的最大元素,分别为6,1,4。局中人Ⅱ会采取?2策略,确保局中人Ⅰ不会超过1分。 ?1和?2分别称为局中人Ⅰ、 Ⅱ的最优策略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。 矩阵对策有解的条件 现在,讨论矩阵对策在纯策略意义下有解的充分必要条件。 证明 必要性 设G在纯策略意义下有解,即成立 但是否每个矩阵对策一定存在鞍点呢?回答是否定的。现在考察下例。 例7 掷硬币投注的对策 两个局中人之间开展有裁判的掷硬币游戏,无论出现正面还是反面,裁判将结果告诉局中人甲,局中人甲看完结果后,有两种选择:(1)放弃投注并支付给局中人乙5美元。如果局中人甲放弃,游戏就结束了。但如果局中人甲投注(bet on),游戏继续,这时局中人乙也有两种选择: (1)放弃投注并支付5美元给局中人甲; (2)跟着下注。如果局中人乙选择下注,裁判将投币结果展示给乙看,如果是正面,局中人乙支付10美元给局中人甲;如果是反面,则局中人甲支付给局中人乙10美元。 (1)试写出对策中各局中人的策略集 (2)建立局中人甲的赢得矩阵 (3)判断对策是否存在鞍点 (4)求解此矩阵对策 解(1)分析对策双方可能采取的策略情况,投币的情况有两种可能,甲

文档评论(0)

558955999 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档