对策论(theoryofgames).pptVIP

下载本文档

7
0
约7.93千字
约 64页
2017-09-08 发布于广东
举报
版权申诉

对策论(theoryofgames).ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

对策论(theoryofgames)

对策论(Theory of Games) 对策论也称博弈论，是运筹学的一个重要分支。1928年冯·诺意曼（J.von Neumann）等人由于经济问题的启发，研究了一类具有某种特性的博弈问题，这是对策论的最早期的工作。由于对策论研究的对象与政治、军事、工业、农业、交通、运输等领域有密切关系，处理问题的方法又有着明显的特色，所以越来越受到人们的注意。对策论(Theory of Games) 一、对策论的概念二、对策模型的三要素三、矩阵对策模型一、对策论的概念 1、对策行为（简称对策）的概念对策行为是指具有竞争或对抗性质的行为，称为对策行为。在这类行为中，竞争对手可能采取的各种策略是清楚的；各方一旦选定了自己的策略，竞争结果就清楚了，竞争结果可以定量描述；双方都希望取得最好的结果而且十分清楚对方也想达到同样的目的。 2、对策论的概念对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案，以及如何找到这个合理的行动方案的数学理论和方法。引例1 表1中数据为双方各种阵容下甲队的得分数。引例2 战国时期，齐王和大将田忌赛马，双方各出三匹马各赛一局。各方的马根据好坏分别称为上马、中马、下马。田忌的马比齐王同一级的马差但比齐王低一级的马好一些。若用同一级马比赛，田忌必然连输三局。每局的赌注为1千金，田忌要输3千金。田忌的谋士建议田忌在赛前先探听齐王赛马的出场次序，然后用自己的下马对齐王的上马，用中马对齐王的下马，用上马对齐王的中马。结果负一局胜两局赢得1千金。但若事先并不知道对方马的出场次序，双方应取何种策略？双方采用的赛马出场次序安排及相应的结果（田忌输的千金数）可由表2列出。表2 引例3 有两个儿童A和B在一起玩“石头-剪子-布”游戏。我们规定胜者得1分，负者得-1分，平手时各得0分。双方选定的各种出法及相应的结果可由下表列出。双方应取何种策略？表3 二、对策模型的三要素我们称具有对策行为的模型为对策模型或对策。对策模型的种类可以千差万别，但本质上都必须包括三个基本要素：（1）局中人（2）策略（3）赢得函数或称支付函数（简称支付） (1)局中人在一个对策行为（或一局对策）中，有权决定自己行动方案的对策参加者称为局中人。如在“齐王赛马”例子中，局中人是齐王与田忌。对策中关于局中人的概念是具有广义性的，局中人除了可以理解为个人外，还可以理解为某一集体，如引例1的球队。在对策中总是假定每一个局中人都是理智的，聪明的决策者或竞争者，即对任一局中人来讲，不存在利用其它局中人决策的失误，来扩大自身利益的可能性。通常用I表示局中人的集合，如果有n个局中人，则I={1，2……n}，一般要求一个对策中至少要有二个局中人。 (2)策略一局对策中，可供局中人选择的一个实际可行的完整的行动方案称为一个策略。策略的全体称为策略集，策略集可以是有限或无限的。若策略集为有限集称为有限对策，否则称为无限对策。参加对策的每个局中人（i∈I）都有自己的策略集，一般，每一局中人的策略集中至少应包括两个策略。注意：策略不能只理解为局中人的一个“动作”。某局中人在一个对策中的一个策略，是指他为对付其他局中人而采取的一个从头到尾的整个行动方案。如，下棋中的某一步只能是策略的一部分而不是一个策略。如：在“齐王赛马”例子中，如用（上、中、下）表示以上马、中马、下马依次参赛次序，这是一个完整的行动方案，即为一个策略。可见，局中人齐王与田忌各自都有六个策略：（上、中、下）、（上、下、中）、（中、上、下）、（中、下、上）、（下、中、上）、（下、上、中）。 (3)赢得函数（支付函数）在一局对策中，当局势给定以后，就用一个数来表示得失（或输赢），显然，这种 “得失”或“输赢”是局势的函数，称为支付函数。例 si是第i个局中人的一个策略，则n个局中人的策略组 S=（s1，s2 …sn）称为一个局势。当局势出现后，对策结果也就确定了，即对任一局势S，局中人i可能得到一个赢得H。显然H是局势S的函数，称为第i 个局中人的赢得函数（支付函数）。齐王赛马中，局中人集合I={1.2} 齐王的策略集用 {α1 ， α2, ， α3 ，,α4 ，,α5 ，,α6}表示田忌的策略集用 {β1, ， β2, ， β3 ，,β4 ，,β5 ，,β6}表示这样齐王的任一策略αi 和田忌的任一策略βj，就决定了一个局势Sij，如果α1=（上、中、下）、β1 =（上、中、下）则在局势S11下齐王的赢得值为H1（S11）=3。田忌的赢得值为H2 （S11）=-3 注意当各局中人选定了自己的策略后，竞争的结果就确定了，而