对策论(theoryofgames).ppt

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对策论(theoryofgames)

对策论(Theory of Games) 对策论也称博弈论,是运筹学的一个重要 分支。1928年冯·诺意曼(J.von Neumann) 等人由于经济问题的启发,研究了一类具 有某种特性的博弈问题,这是对策论的最 早期的工作。由于对策论研究的对象与政 治、军事、工业、农业、交通、运输等领 域有密切关系,处理问题的方法又有着明 显的特色,所以越来越受到人们的注意。 对策论(Theory of Games) 一、对策论的概念 二、对策模型的三要素 三、矩阵对策模型 一、对策论的概念 1、对策行为(简称对策)的概念 对策行为是指具有竞争或对抗性质的行为,称为 对策行为。在这类行为中, 竞争对手可能采取的各种策略是清楚的; 各方一旦选定了自己的策略,竞争结果就 清楚了,竞争结果可以定量描述; 双方都希望取得最好的结果而且十分清楚 对方也想达到同样的目的。 2、对策论的概念 对策论就是研究对策行为中斗争各方是否 存在着最合理的行动方案,以及如何找到 这个合理的行动方案的数学理论和方法。 引例1 表1中数据为双方各种阵容下甲队的得分数。 引例2 战国时期,齐王和大将田忌赛马,双方各出三匹 马各赛一局。各方的马根据好坏分别称为上马、中马、下马。田忌的马比齐王同一级的马差但比齐王低一级的马好一些。若用同一级马比赛,田忌必然连输三局。每局的赌注为1千金,田忌要输3千金。田忌的谋士建议田忌在赛前先探听齐王赛马的出场次序,然后用自己的下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。结果负一局胜两局赢得1千金。但若事先并不知道对方马的出场次序,双方应取何种策略?双方采用的赛马出场次序安排及相应的结果(田忌输的千金数)可由表2列出。 表2 引例3 有两个儿童A和B在一起玩“石头-剪子-布”游戏。我们规定胜者得1分,负者得-1分,平手时各得0分。双方选定的各种出法及相应的结果可由下表列出。双方应取何种策略? 表3 二、对策模型的三要素 我们称具有对策行为的模型为对策模型或 对策。对策模型的种类可以千差万别,但 本质上都必须包括三个基本要素: (1)局中人 (2)策略 (3)赢得函数或称支付函数(简称支付) (1)局中人 在一个对策行为(或一局对策)中, 有权决定自己行动方案的对策参加者 称为局中人。如在“齐王赛马”例子中,局中人是齐王与田忌。 对策中关于局中人的概念是具有广义 性的,局中人除了可以理解为个人外, 还可以理解为某一集体,如引例1的球队。 在对策中总是假定每一个局中人都是理智 的,聪明的决策者或竞争者,即对任一局 中人来讲,不存在利用其它局中人决策的 失误,来扩大自身利益的可能性。 通常用I表示局中人的集合,如果有n个局 中人,则I={1,2……n},一般要求一个对策中至少要有二个局中人。 (2)策略 一局对策中,可供局中人选择的一个实际可行 的完整的行动方案称为一个策略。 策略的全体称为策略集,策略集可以是有限或 无限的。若策略集为有限集称为有限对策,否则 称为无限对策。 参加对策的每个局中人(i∈I)都有自己的策 略集 ,一般,每一局中人的策略集中至少应 包括两个策略。 注意: 策略不能只理解为局中人的一个“动作”。 某局中人在一个对策中的一个策略,是指 他为对付其他局中人而采取的一个从头到 尾的整个行动方案。如,下棋中的某一步 只能是策略的一部分而不是一个策略。 如:在“齐王赛马”例子中,如用(上、中、下)表示以上马、中马、下马依次参赛次序,这是一个完整的行动方案,即为一个策略。可见,局中人齐王与田忌各自都有六个策略:(上、中、下)、(上、下、中)、(中、上、下)、(中、下、上)、(下、中、上)、(下、上、中)。 (3)赢得函数(支付函数) 在一局对策中,当局势给定以后,就用一 个数来表示得失(或输赢),显然,这种 “得失”或“输赢”是局势的函数,称为支付 函数。 例 si是第i个局中人的一个策略,则n个局 中人的策略组 S=(s1,s2 …sn)称为一个 局势。当局势出现后,对策结果也就确定 了,即对任一局势S,局中人i可能得到一 个赢得H。显然H是局势S的函数,称为第i 个局中人的赢得函数(支付函数)。 齐王赛马中,局中人集合I={1.2} 齐王的策略集用 {α1 , α2, , α3 ,,α4 ,,α5 ,,α6}表示 田忌的策略集用 {β1, , β2, , β3 ,,β4 ,,β5 ,,β6}表示 这样齐王的任一策略αi 和田忌的任一策略βj, 就决定了一个局势Sij,如果α1=(上、中、 下)、β1 =(上、中、下)则在局势S11下齐王 的赢得值为H1(S11)=3。田忌的赢得值为H2 (S11)=-3 注意 当各局中人选定了自己的策略后,竞争的结果就确定了,而

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档