求解矩阵对策的方法下面求局中人Ⅰ的最优策略.PPT

下载文档 降价啦

158
0
约1.46万字
约 120页
2018-03-22 发布于天津
举报
版权申诉
保障服务

求解矩阵对策的方法下面求局中人Ⅰ的最优策略.PPT

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

求解矩阵对策的方法下面求局中人Ⅰ的最优策略

第7章对策论内容提要 ? 对策模型中的基本要素 ? 矩阵对策（两人有限零和对策）的纯策略 ? 矩阵对策的混合策略 ? 求解矩阵对策的方法 7.1 引言对策论也叫做博弈论。 “博弈”一词的英文单词是Game，意为对策、游戏等；因此，一谈到博弈，人们自然会想到游戏。对策论的早期思想也确实源于游戏。在诸如下棋、打牌、划拳等游戏中，人们要解决的问题是如何才能获胜。这实际上是当事人面对一定的信息量寻求最佳行动和最优策略问题。 7.1 引言在实际生活中，许多游戏都反映了对策论的思想。例如，在人们非常熟悉的“石头、剪刀、布”的游戏中，我们的问题是：对方如何行动，而我又将如何应对才能取得胜利？这实际上就涉及到了对策论的核心问题，即对策论以对方的行为作为自己决策的依据，并寻求最佳。但对策论不仅仅是指游戏，它研究的是当人们的行为存在相互作用时的策略行为及其后果。社会生活中的许多现象，都带有相互竞争与合作的特征，可以说，一切都在博弈或对策之中。 7.2 对策模型的基本要素为了对对策问题在数学上进行分析，需要建立对策问题的数学模型，称之为对策模型。根据所研究问题的性质的不同，可建立不同的对策模型。不论模型在形式上有何不同，但模型都必须包括以下几个基本要素。 7.2 对策模型的基本要素 1．局中人在一个对策行为中，有权决定自己行动方案的对策参加者被称为局中人。一般要求一个对策中至少有两个局中人。局中人的集合用字母I表示。 7.2 对策模型的基本要素局中人除了理解为个人外，还可以理解为集体（如球队、交战国、企业公司等），也可以把大自然理解为局中人（因为人类经常处于和大自然的斗争状态中）；另外，还假定局中人都是聪明的，有理智的。 7.2 对策模型的基本要素同时，为使所研究的问题更加清晰，把那些利益完全一致的参加者们看做一个局中人，因为他们利害一致，必使他们齐心合力，相互配合行动如一个人。例如，桥牌游戏中，东西双方利益一致，南北两面得失相当，所以虽有四人参加，只能算有两个局中人。我们称只有两个局中人的对策现象为“两人对策”（如象棋、桥牌），而多于两个局中人的对策称为“多人对策”。另外，根据局中人之间是否允许进行合作，还可有“结盟对策”和“不结盟对策”等。 7.2 对策模型的基本要素 2．策略一局对策中，每个局中人都有供他选择的实际可行的完整的行动方案。此方案不是某一步的行动方案，而是指导自始至终如何行动的一个方案。局中人一个可行的自始至终通盘筹划的行动方案，称为这个局中人的一个策略。而把这个局中人的策略全体，称做这个局中人的策略集合。 7.2 对策模型的基本要素例如，在下象棋中“当头炮”只作为某一个策略的组成部分，而并非一个策略。在齐王与田忌赛马的例子中，如果一开始就要把各人的三匹马排好次序，然后依次出赛。那么，三匹马排列的一个次序就是一个完整的行动方案，于是被称为一个策略。例如，用“上、中、下”表示首先是上马出赛，其次是中马出赛，最后是下马出赛这样一个策略。显然，各局中人都有6个策略，即 7.2 对策模型的基本要素 ① 上、中、下；② 上、下、中；③ 中、上、下；④ 中、下、上；⑤ 下、中、上；⑥ 下、上、中。这个策略全体就是局中人的策略集合。如果在一局对策中，各个局中人都有有限个策略，则称之为“有限对策”（齐王与田忌赛马就是一个有限对策）；否则称之为“无限对策”。 7.2 对策模型的基本要素 3．局势集合在对策过程中，从每个局中人的策略集合中各取一个策略，所组成的策略组称做“局势”，可能产生的各种局势的全体，被称为局势集合。局势集合用字母Ω表示。在某些局势下对局结束，这种局势称为最终局势。 7.2 对策模型的基本要素 4．收益函数一局对策结束之后，对每个局中人来说，不外乎是胜利或失败，名次的前后，以及其他物质的收入或支出等，这些可以统称之为“得失”或“益损”。在齐王与田忌赛马的例子中，最后田忌赢得1千金，而齐王损失1千金，即为这局对策（结局时）双方的“得失”。 7.2 对策模型的基本要素实际上，每个局中人在一局对策结束时的得失，与局中人所选定的策略有关。例如，上述赛马的例子中，当齐王出策略“上、中、下”，田忌出策略“下、上、中”时，田忌得千金；而如果齐王与田忌都出策略“上、中、下”时，田忌就得付出三千金了。所以用数学语言来说，一局对策结束时，每个局中人的“得失”是全体局中人所取定的一组策略的函数。通常称为