双人零和博弈精选.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
双人零和博弈精选

一、双人零和博弈的概念 零和博弈又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,一方收益多少,另一方就损失多少,所以博弈各方的收益和损失相加总和永远为“零”.双方不存在合作的可能.用通俗的话来讲也可以说是:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方在决策时都以自己的最大利益为目标,想尽一切办法以实现“损人利己”.零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分. 二、双人零和博弈的模型的建立 建立双人零和博弈的模型,就是要根据对实际问题的叙述确定参与人(局中人)的策略集以及相应的收益矩阵(支付矩阵).我们记双人零和博弈中的两个局中人为A和B;局中人A的策略集为a,…,a,局中人B的策略集为b,…,b;c为局中人A采取策略a、 局中人B采取策略b时A的收益(这时局中人B的收益为- c).则收益矩阵见下表 表1 局中人B 局中人A 策 略 b b … b 策 略 a a … a c c ? cb c c ? cb ? ? ? c c ? c 那么下面我们通过例子来说明双人零和博弈模型的建立: 例1 甲、乙两名儿童玩猜拳游戏.游戏中双方同时分别或伸出拳头(代表石头)、或手掌(代表布)、或两个手指(代表剪刀).规则是剪刀赢布,布赢石头,石头赢剪刀,赢者得一分.若双方所出相同,算和局,均不得分.试列出对儿童甲的赢得矩阵. 解 本例中儿童甲或乙均有三个策略:或出拳头,或出手掌,或出两个手指,根据例子中所述规则,可列出对儿童甲的赢得矩阵见表2. 表2 甲 乙 石头 布 剪刀 石头 布 剪刀 0 -1 1 1 0 -1 -1 1 0 例2 从一张红牌和一张黑牌中随机抽取一张,在对B保密情况下拿给A看,若A看到的是红牌,他可选择或掷硬币决定胜负,或让B猜.若选择掷硬币,当出现正面,A赢p元,出现反面,输q元;若让B猜,当B猜中是红牌,A输r元,反之B猜是黑牌,A赢s元.若A看到的是黑牌,他只能让B猜.当B猜中是黑牌,A输u元,反之B猜是红牌,A赢t元,试确定A、B各自的策略,建立支付矩阵. 解 因A的赢得和损失分别是B的损失和赢得,故属二人零和博弈.为便于分析,可画出如图3的博弈树图. 图3中,○为随机点,□分别为A和B的决策点,从图中看出A的策略有掷硬币和让B猜两种,B的策略有猜红和猜黑两种,据此可归纳出各种情况下A和B输赢值分析的表格,见表4. 图3 表4 B A 抽到红牌(1/2) 抽到(1/2) 正面(1/2) 反面(1/2) 猜 红 猜 黑 猜红 猜黑 猜红 猜黑 掷硬币 让B猜 P -r P s -q -r -q s t t -u -u 对表4中各栏数字可以这样来理解:因让A看到红牌时或掷硬币或让B猜.若A决定选掷硬币这个策略,当出现正面,这时不管B猜红或猜黑,A都赢p元;当出现反面,不管B猜红或猜黑,A都输q元.同样A选择让B猜的策略后,他的输赢只同B猜红或猜黑有关,而与掷硬币的正反面无关.又若抽到的牌是黑牌,A的决定只能让B猜,因而掷硬币策略对A的胜负同样不起作用.考虑到抽牌时的红与黑的概率各为1/2,掷硬币时出现正反面的概率也各为1/2,故当A采取“掷硬币”策略,而B选择“猜红”策略时,A的期望赢得为: += 当A采取让B猜策略,B选择“猜红”策略时,A的期望赢得为: += 相应可求得其他策略对A的期望赢得值.由此可列出本例的收益矩阵,见表5. 表5 猜 红 猜 黑 掷硬币 让B猜 三、双人零和博弈的求解 定理1(极小极

文档评论(0)

tazhiq2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档