- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
求解矩阵对策的方法下面求局中人Ⅰ的最优策略
第7章 对 策 论 内容提要 ? 对策模型中的基本要素 ? 矩阵对策(两人有限零和对策)的纯策略 ? 矩阵对策的混合策略 ? 求解矩阵对策的方法 7.1 引言 对策论也叫做博弈论。 “博弈”一词的英文单词是Game,意为对策、游戏等;因此,一谈到博弈,人们自然会想到游戏。对策论的早期思想也确实源于游戏。在诸如下棋、打牌、划拳等游戏中,人们要解决的问题是如何才能获胜。这实际上是当事人面对一定的信息量寻求最佳行动和最优策略问题。 7.1 引言 在实际生活中,许多游戏都反映了对策论的思想。例如,在人们非常熟悉的“石头、剪刀、布”的游戏中,我们的问题是:对方如何行动,而我又将如何应对才能取得胜利?这实际上就涉及到了对策论的核心问题,即对策论以对方的行为作为自己决策的依据,并寻求最佳。但对策论不仅仅是指游戏,它研究的是当人们的行为存在相互作用时的策略行为及其后果。社会生活中的许多现象,都带有相互竞争与合作的特征,可以说,一切都在博弈或对策之中。 7.2 对策模型的基本要素 为了对对策问题在数学上进行分析,需要建立对策问题的数学模型,称之为对策模型。根据所研究问题的性质的不同,可建立不同的对策模型。不论模型在形式上有何不同,但模型都必须包括以下几个基本要素。 7.2 对策模型的基本要素 1.局中人 在一个对策行为中,有权决定自己行动方案的对策参加者被称为局中人。一般要求一个对策中至少有两个局中人。局中人的集合用字母I表示。 7.2 对策模型的基本要素 局中人除了理解为个人外,还可以理解为集体(如球队、交战国、企业公司等),也可以把大自然理解为局中人(因为人类经常处于和大自然的斗争状态中);另外,还假定局中人都是聪明的,有理智的。 7.2 对策模型的基本要素 同时,为使所研究的问题更加清晰,把那些利益完全一致的参加者们看做一个局中人,因为他们利害一致,必使他们齐心合力,相互配合行动如一个人。例如,桥牌游戏中,东西双方利益一致,南北两面得失相当,所以虽有四人参加,只能算有两个局中人。我们称只有两个局中人的对策现象为“两人对策”(如象棋、桥牌),而多于两个局中人的对策称为“多人对策”。另外,根据局中人之间是否允许进行合作,还可有“结盟对策”和“不结盟对策”等。 7.2 对策模型的基本要素 2.策略 一局对策中,每个局中人都有供他选择的实际可行的完整的行动方案。此方案不是某一步的行动方案,而是指导自始至终如何行动的一个方案。局中人一个可行的自始至终通盘筹划的行动方案,称为这个局中人的一个策略。而把这个局中人的策略全体,称做这个局中人的策略集合。 7.2 对策模型的基本要素 例如,在下象棋中“当头炮”只作为某一个策略的组成部分,而并非一个策略。在齐王与田忌赛马的例子中,如果一开始就要把各人的三匹马排好次序,然后依次出赛。那么,三匹马排列的一个次序就是一个完整的行动方案,于是被称为一个策略。例如,用“上、中、下”表示首先是上马出赛,其次是中马出赛,最后是下马出赛这样一个策略。显然,各局中人都有6个策略,即 7.2 对策模型的基本要素 ① 上、中、下;② 上、下、中;③ 中、上、下;④ 中、下、上;⑤ 下、中、上;⑥ 下、上、中。 这个策略全体就是局中人的策略集合。 如果在一局对策中,各个局中人都有有限个策略,则称之为“有限对策”(齐王与田忌赛马就是一个有限对策);否则称之为“无限对策”。 7.2 对策模型的基本要素 3.局势集合 在对策过程中,从每个局中人的策略集合中各取一个策略,所组成的策略组称做“局势”,可能产生的各种局势的全体,被称为局势集合。局势集合用字母Ω表示。在某些局势下对局结束,这种局势称为最终局势。 7.2 对策模型的基本要素 4.收益函数 一局对策结束之后,对每个局中人来说,不外乎是胜利或失败,名次的前后,以及其他物质的收入或支出等,这些可以统称之为“得失”或“益损”。 在齐王与田忌赛马的例子中,最后田忌赢得1千金,而齐王损失1千金,即为这局对策(结局时)双方的“得失”。 7.2 对策模型的基本要素 实际上,每个局中人在一局对策结束时的得失,与局中人所选定的策略有关。例如,上述赛马的例子中,当齐王出策略“上、中、下”,田忌出策略“下、上、中”时,田忌得千金;而如果齐王与田忌都出策略“上、中、下”时,田忌就得付出三千金了。所以用数学语言来说,一局对策结束时,每个局中人的“得失”是全体局中人所取定的一组策略的函数。通常称为
您可能关注的文档
- 梵谷孟克风格特色造型上的追求强烈对比.PPT
- 检测报告上海质量监督检验技术研究院国家日用-上海第十中学.PDF
- 检测十二基因传递的一般规律课后加练卷.DOC
- 棘皮动物门-资料中心-生物在线.DOC
- 检测预约管理-安徽大型科学仪器设备共享服务平台.DOC
- 梅赛德斯-迈巴赫S级轿车.PDF
- 森林资源-安徽林业厅.DOC
- 植基於毕诺扫瞄之可逆式资讯隐藏研究-NPUCSIE.PDF
- 森林群落生态学.PPT
- 植物生态学实习环境调查在植物生态学野外实习或调查.DOC
- 汇丰银行离岸人民币债券指数CNH指数-指数说明书.PDF
- 汇率制度及其选择.PPT
- 求圆柱相贯线步骤.PPT
- 汉森制药2012年第一次临时股东大会法律意见-湖南汉森制药股份.DOC
- 汕头澄海区益民路路树补植工程泰然路路树-汕头澄海区政府.DOC
- 江南大学国内会议费管理办法-江南大学财务处.DOC
- 江河奔放天意弄人金科玉律如意祥龙RACE10HRATING30-0Class.PDF
- 江苏二00八年普通高中学生学业水平考试-pokerqualifierscom.DOC
- 江苏响水中学高一生物导学案主备人李春201QUICKBIDSapp.DOC
- 江苏公证天业会计师事务所特殊普通合伙-石油专用管-江苏常宝.PDF
文档评论(0)