- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
双人零与博弈
一、双人零和博弈的概念
零和博弈又称 HYPERLINK /view/309007.htm \t _blank 零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,一方收益多少,另一方就损失多少,所以博弈各方的收益和损失相加总和永远为“零”.双方不存在合作的可能.用通俗的话来讲也可以说是:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方在决策时都以自己的最大利益为目标,想尽一切办法以实现“损人利己”.零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分.
二、双人零和博弈的模型的建立
建立双人零和博弈的模型,就是要根据对实际问题的叙述确定参与人(局中人)的策略集以及相应的收益矩阵(支付矩阵).我们记双人零和博弈中的两个局中人为A和B;局中人A的策略集为a,…,a,局中人B的策略集为b,…,b;c为局中人A采取策略a、
局中人B采取策略b时A的收益(这时局中人B的收益为- c).则收益矩阵见下表
表1
局中人B
局中人A
策 略
b b … b
策
略
a
a
…
a
c c … c
c c … c
… … …
c c … c
那么下面我们通过例子来说明双人零和博弈模型的建立:
例1 甲、乙两名儿童玩猜拳游戏.游戏中双方同时分别或伸出拳头(代表石头)、或手掌(代表布)、或两个手指(代表剪刀).规则是剪刀赢布,布赢石头,石头赢剪刀,赢者得一分.若双方所出相同,算和局,均不得分.试列出对儿童甲的赢得矩阵.
解 本例中儿童甲或乙均有三个策略:或出拳头,或出手掌,或出两个手指,根据例子中所述规则,可列出对儿童甲的赢得矩阵见表2.
表2
甲 乙
石头 布 剪刀
石头
布
剪刀
0 -1 1
1 0 -1
-1 1 0
例2 从一张红牌和一张黑牌中随机抽取一张,在对B保密情况下拿给A看,若A看到的是红牌,他可选择或掷硬币决定胜负,或让B猜.若选择掷硬币,当出现正面,A赢p元,出现反面,输q元;若让B猜,当B猜中是红牌,A输r元,反之B猜是黑牌,A赢s元.若A看到的是黑牌,他只能让B猜.当B猜中是黑牌,A输u元,反之B猜是红牌,A赢t元,试确定A、B各自的策略,建立支付矩阵.
解 因A的赢得和损失分别是B的损失和赢得,故属二人零和博弈.为便于分析,可画出如图3的博弈树图.
图3中,○为随机点,□分别为A和B的决策点,从图中看出A的策略有掷硬币和让B猜两种,B的策略有猜红和猜黑两种,据此可归纳出各种情况下A和B输赢值分析的表格,见表4.
图3
表4
B
A
抽到红牌(1/2)
抽到(1/2)
正面(1/2)
反面(1/2)
猜
红
猜
黑
猜红
猜黑
猜红
猜黑
掷硬币
让B猜
P
-r
P
s
-q
-r
-q
s
t
t
-u
-u
对表4中各栏数字可以这样来理解:因让A看到红牌时或掷硬币或让B猜.若A决定选掷硬币这个策略,当出现正面,这时不管B猜红或猜黑,A都赢p元;当出现反面,不管B猜红或猜黑,A都输q元.同样A选择让B猜的策略后,他的输赢只同B猜红或猜黑有关,而与掷硬币的正反面无关.又若抽到的牌是黑牌,A的决定只能让B猜,因而掷硬币策略对A的胜负同样不起作用.考虑到抽牌时的红与黑的概率各为1/2,掷硬币时出现正反面的概率也各为1/2,故当A采取“掷硬币”策略,而B选择“猜红”策略时,A的期望赢得为:
+=
当A采取让B猜策略,B选择“猜红”策略时,A的期望赢得为:
+=
相应可求得其他策略对A的期望赢得值.由此可列出本例的收益矩阵,见表5.
表5
猜 红
猜 黑
掷硬币
让B猜
三
您可能关注的文档
最近下载
- 侠客风云传养成模式触发剧情一览.pdf VIP
- YST 582-2013 电池级碳酸锂.pdf
- 淘股吧高手语录.docx VIP
- 2024~2025学年上学期七年级第一次月考数学试题(含答案).pdf VIP
- GB-T6284-1986化工产品中水分含量测定的通用方法重量法.pdf
- MSC:人工智能赋能可持续发展和投资白皮书.pdf VIP
- 24J306 窗井、设备吊装口、排水沟、集水坑图集.docx VIP
- 2014年深圳市坪山新区主要病媒生物监测及白纹伊蚊抗药性研究.pdf VIP
- T∕CBDA 69-2023 建筑装饰装修碳排放计算标准.pdf
- 国际私法(暨南大学)中国大学MOOC 慕课 章节测验 期末考试答案.docx VIP
文档评论(0)