第9章 对策论.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章 对策论.ppt

对策论(game theory) 由“齐王赛马”引入 §1 对策论的基本概念 三个基本要素; 1.局中人(player):参与对抗的各方; 2.策略集(strategy set): 局中人选择对付其它局中人的行动方案称为策略。 某局中人的所有可能策略全体称为策略集; 3.局势对策的支付(payoff):各局中人各自使用一个对策就形成一个局势,一个局势决定了局中众人 的对策结果(量化)称为该局势对策的支付或赢得。 模 型 局中人 两个或两个以上---决策者 策略集合 策略----决策 局势----状态 支付函数 支付关于局势的函数----决策依据和标准 模型 分 类 局中人 两人对策、多人对策 策略 有限对策、无限对策;非合作对策、合作对策 支付 零和对策、非零和对策 时间 单阶段对策、多阶段对策 §2.矩阵对策及其解 二人有限零和对策:(又称矩阵对策) 局中人为2; 每局中人的策略集中策略权目有限; 每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。 局中人:两人 策略集: 局势集: 支付函数: 矩阵表示: “齐王赛马”齐王在各局势中的益损值表(单位:千金) 其中: 齐王的策略集: S1={?1,?2,?3,?4,?5,?6} 田忌的策略集:S1={?1,?2,?3,?4,?5,?6} 下列矩阵称齐王的赢得矩阵: 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 2.矩阵对策的最优纯策略 在甲方赢得矩阵中: A=[aij]m*n i行代表甲方策略 i=1,2…m J列代表乙方策略 j=1,2…n aij代表甲方取策略i,乙方取策略j,这一局势下甲方的益损值,此时乙方的益损值为-aij(零和性质)。 在讨论各方采用的策略是必须注意一个前提就是对方是理智的。这就是要从最有把握取得的益损值情况考虑。 2.矩阵对策的最优纯策略(续) 例:有交易双方公司甲和乙,甲有三个策略?1,?2,?3;乙有四个策略?1,?2,?3,?4,根据获利情况建立甲方的(益损值)赢得矩阵。 -3 0 -2 0 A= 2 3 0 1 -2 -4 -1 3 问:甲公司应采取什么策略比较适合? 甲: 采取?1至少得益–3(损失 3) ?2 0 ?3 -4(损失 4) 乙: 采取?1甲最多得益2 (乙最多损失2) ?2 3(乙得益-3) ?3 0(乙得益 0) ?4 3(乙得益-3) 甲采取策略?2 不管乙采取如何策略,都至少得益。 乙采取策略?3 不管甲采取如何策略, 都至少可以得益。(最多损失0) ?2, ?3分别称甲,乙公司的最优策略,由唯一性又称最优纯策略。 (?2, ?3)-均 衡局势(均衡解) 均 衡局势的存在前提: max min aij = min max aij = v i j j i 又称( ?2 ,?3 )为对策G={s1,s2,A}的鞍点。 值V为G的值。 最 稳 妥 策 略 证明 例 子 3.矩阵对策的混合策略 设矩阵对策 G ={S1,S2;A} 当 max min aij ? min max aij i j j i 时,不存在最优纯策略 求解混合策略。 例:设一个赢得矩阵如下: min 5 9 5 A = max 6 策

文档评论(0)

xx88606 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档