网站大量收购闲置独家精品文档,联系QQ:2885784924

数学建模博弈论.pdfVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数学建模博弈论

数学建模(十)博弈论_博弈论数学建模-CSDN博客

在前一讲中,我们讨论了决策论,其中决策者面对的结果和支

付只依赖于他本人的决策,而不依赖一个或者多个其他参与者

的决策。决策论最后决定的结果可能存在机会和风险,但不会

与另一个参与者的决策有关系。比如假定两个国家在军备竞赛

而希望裁军,如果一方裁军,这个国家的结果不仅依赖于该国

的决策,也依赖于第二个国家的决策。如果只依赖于一个参与

者,我们把这类决策模型称为决策论;如果结果依赖于多于一

个参与者的决策,我们把这类决策模型称为博弈论;10.1:博

弈论:完全冲突:按照参与者之间的冲突是完全冲突还是部分

冲突对博弈论进行分类。进一步把完全冲突的博弈按照最优策

略是纯策略还是混合策略进行分类。

举例1:一个有纯策略的完全冲突博弈:例如有两家连锁店,

都同时想在两个城市开连锁店,假设为A,B两地,如图所示是

两个连锁店所占的市场份额:从上图可以发现两家连锁店其中

一家每得到一点份额都是需要另一家失去一点份额,而市场总

额是1,并且两家连锁店的决策结果不仅取决于自身还取决与

对手的策略。这个博弈是完全冲突的。定义:纯策略是参与

者可采取的行动的集合,每个参与者选定的策略共同决定博弈

的结果以及每个参与者的花费。通过图中数据我们也可以发

现,无论甲连锁店开在何处,乙连锁店只需要开在A地就可以

始终占优。占优策略:定义:策略A占优与策略B,是指策略

A的每一个结果至少和B的对应结果一样好,并且至少A的某

一个结果严格优于B的对应结果。占优原理:在严格冲突博弈

中,一个理性的参与者应该永远不要采用被占优的策略。同时

也可以发现结果(A,A)即两个连锁店都开在A地时,此时没有

任何一个参与者可以单方面改变策略而使得自己获得改善,这

种情况我们称为纳什均衡:表示这样一个结果,任何一个参

与者都不能通过单方面更改策略而获得好处。同时由于这些每

个结果和是1,完全冲突博弈也称作常数和博弈:如果对每

一个可能的结果,每个参与者的支付之和是同一个常数,这个

博弈称为完全冲突博弈。

举例2:一个有混合策略的完全冲突博弈:这里是以击球手与

发球手来说明,发球手可以发出两种球,而接球手也可以接两

种球,发球手选择一种球发出,而接球手需要提前判断并采取

相应的措施,一个参与者总是可以通过单方面更改策略而使自

己得到改善。这里就有混合策略:对一个参与者的纯策略的随

机化,即对参与者的每一个纯策略指定一定的概率,该概率表

示这个纯策略被采用的相对频率。

10.1:博弈论:部分冲突:在前两个例子中,决策者的冲突是

完全的,意思是没有参与者在不伤害其他参与者的前提下能够

使自己得到改善。下面的例子就是部分冲突的:例如两个在军

事竞赛的国家已经陷入僵局,假如国家A有两种选择,裁军或

者保持,国家B也有同样的两种选择:所以如图所示,如果两

个国家都保持军备那么就是次差选项,但是两个国家都可以通

过改变策略在不伤害对方的基础上使得自己的情况得到改善,

这种博弈就是部分冲突。我们将研究为了使每个国家都得到改

善,需要克服怎样的障碍,我们可以看到许多博弈中合作是有

益的,但可能会存在很强的不合作动机。定义:如果对于每一

个可能的结果,每个参与者的支付之和不是同一个常数,此类

博弈是部分冲突的。

在研究部分冲突时的一个重要区别是博弈如何进行的,有没有

交流,有没有仲裁,交流的形式可能是自己先出招并告知另一

参与者你已经出招,以便威胁阻止对手选择对你不利的策略,

或者承诺对手选择你所喜欢的策略时,你会选取某个特定的策

略。最后仲裁是一种根据每个参与者的策略优势找到的一个基

于协商获得的公平解的方法。

10.2完全冲突博弈的线性规划模型:纯策略与混合策略如之

前说的击球手与发球手:现在需要解除策略的最优混合方式,

每个参与者决定如何采用每个策略。如果我们知道每个参与者

采用其中两个策略的概率,计算击球平均分就是求期望值,若

投球手以1/2的概率采用快球策略,以1/2的概率采用弧线球

策略,击球手以3/4的概率采用快球策略,以1/4的概率采用

弧线球策略,那么其击球平均分为:

E=0.41/23/4+0.11/21/4+0.21/23/4+0.31/21/4=0.275;其决策

树如下:首先对击球手进行建模:首先考虑击球手的决策,他

希望选择猜测快球或者弧线球的某种组合,使击球平均分最

大。我们定义以下变量:A:击球平均分x:

文档评论(0)

175****5065 + 关注
实名认证
文档贡献者

一线教师

1亿VIP精品文档

相关文档