- 1、本文档共74页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优化建模与LINGO第9章.ppt
定义9.3 设有矩阵对策 G={S1,S2,C}称 3. 混合对策求解方法 通常用线性规划方法求混合策略的解。设 局中人A分别以x1,x2, …,xm 的概率混合使用他的m种策略,局中人B分 别以y1,y2, …,ym 的概率混合使用他的n种策略。 得到最优解(只保留相关部分) 1.2 二人常数和对策 所谓常数和对策是指局中人A和局中人B所赢得的值之和为一常数. 显然,二人零和对策是二人常数和的特例,即常数为零。 对于二人常数和对策,有纯策略对策和混合策略对策。其求解方法基本上是相同的。 例9.4 在晚8点至9点这个时段,两家电视台在竞争100万电视观众收看自己的电视节目,并且电视台必须实时公布自己在下一时段的展播内容。电视台1可能选择的展播方式及可能得到的观众如表所示。 解:事实上,对方得到的,就是自己失去的,完全利用二人零和的方法确定最优纯策略,即 因此,电视台1选择播放连续剧,赢得45万观众,电视台2播放西部片,赢得100-45=55万观众。 §2 二人非常数和对策 二人非常数和对策也称为双矩阵对策。在前面介绍的常数和(零和)对策中,均包含两种情况,纯策略和混合策略。对于非常数对策,也包含这两种策略。 例9.6给出了典型的二人非常数和对策,每人的收益矩阵是不相同的,因此称为双矩阵对策。 通常规定,双矩阵中,第一个元素是局中人A的赢得值,第二个元素是局中人B的赢得值。 问题分析: 这是一个二人非常数和对策问题。从表面看,两犯罪嫌疑人拒不坦白,只能被判1年徒刑,结果是最好的。 但仔细分析,确无法做到这一点。因为犯罪嫌疑人甲如果采用不坦白策略,他可能被判的刑期为1到10年,而犯罪嫌疑人乙可能判的刑期为0到1年。 局中人A、B的支付矩阵 为局中人A的支付(赢得)矩阵, 为局中人B的支付(赢得)矩阵。 因此,矩阵对策记为: G={A,B;S1,S2,CA,CB}或G={S1,S2,CA,CB} 2.混合对策问题 如果不存在使式(18)成立的对策,则需要求混合对策。类似于二人常数和对策情况,需要给出混合对策的最优解。 1.混合对策问题的基本概念 定义9.6 在对策G=\{S1, S2, CA, CB}中,若存在策略对 使得 例9.8 有甲、乙两支游泳队举行包括三个项目的对抗赛。这两支游泳队各有一名健将级运动员(甲队为李,乙队为王),在三个项目中成绩很突出。但规则准许他们每个人分别只能参加两项比赛,而每队的其他两名运动员则可参加全部三项比赛。各运动员的成绩如表9-8所示。 §3 n人合作对策初步 n人合作对策在理论上较为复杂,这里只用一些例子简单介绍n人合作对策的基本思想,和用LINGO软件求解对策的方法。 例9.11 甲有一匹马,对他自己来说,其价值为0, 而对乙和丙(买主)来说分别价值90和100个货币单位。试建立3人合作对策,使得每人的利益最大。 70 58 45 max 14 70 14 38 喜剧片 45 50 58 45 连续剧 15 60 15 35 西部片 电视台1 喜剧片 连续剧 西部片 min 电视台 2. 混合对策 对于常数和对策,也存在混合对策,同样可以采用线性规划方法求解,这里就不举例子了。 1.纯对策问题 例9.6:囚徒的困境 (表9.2.1) (-1,-1) (-10,0) 不坦白 (0,-10) (-3,-3) 坦白 甲 不坦白 坦白 乙 例9.6 设有甲、乙两名嫌疑犯因同一桩罪行被捕,由于希望他们坦白并提供对方的犯罪证据,规定如两人均坦白各判刑3年;如上方坦白另一方不坦白,坦白一方从轻释放,不坦白一方判刑10年;如两人均不坦白,由于犯罪事实很多不能成立,只能各判1年,见表9.2.1所示。 试分析甲、乙两犯罪嫌疑人各自采用什么策略使自己的刑期最短。 而甲选择坦白,他被判的刑期为0到3年,此时,犯罪嫌疑人乙可能判的刑期为3到10年。因此,犯罪嫌疑人甲一定选择坦白。 基于同样的道理,犯罪嫌疑人乙也只能选择坦白。 选择坦白是他们最好的选择,各自被判3年。 事实上,设(cijA, cijB)是甲、乙赢得值,则甲、乙采用的策略是 1. 纯对策问题的基本概念 按照上面的论述,对于一般纯对策问题,局中人A、B的支付(赢得)矩阵由表9.2.2所示。 … αm ┆ ┆ ┆ ┆ … α2 … α1 βn … β2 β1 定义9.5:设G={S1,S2,CA,CB}是一双矩阵对策,若等式 成立,则记vA= ,并称vA为局中人A的赢得值,记vB= ,并称vB为局中人B的赢得值,称(αi*,β j*)为G在纯策略下的解(或Nash平衡点),称αi*和β j*分别为局中人A、B的最优纯策略。
文档评论(0)