第三節2x2矩陣型混合策略競賽.ppt

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三節2x2矩陣型混合策略競賽

第三節 2×2 矩陣型混和策略競賽 我們先討論最簡單的2×2 矩陣型混合策略競賽,當參賽者雙方均只有兩種策略可用的時候,而且並無鞍點存在,如下例。 設有一報酬矩陣為 按前述雙方最佳策略準則,R方依小中取大準則應挑選 a22 元素為 2,而C方依大中取小準則應挑選 a12 元素為 3 ,兩者數值並非同一元素, 故無鞍點存在。雙方會採取「混合策略」的行動,讓競爭對手無法猜測自己的行動,這種策略混合使用的行動,稱為混合策略。對於 2×2 矩陣型混合策略競賽之解法,較常用的三種:(一)圖解法、(二)公式解和(三)算術簡便法。茲一一介紹如下 圖解法 因 R 方有兩種策略可用,令使用 R1 的機率為 p1,使用 R2 的機率為 p2,又 p1+ p2 = 1,則 p2 = 1 – p1 。 當 C 方採取 C1 策略時,則 R 方的期望報酬為: E1 = -p1 + 4 (1-p1) = 4 – 5p1 (a) 當 C 方採取 C2 策略時,則 R 方的期望報酬為: E2 = 3p1 + 2 (1-p1) = 2 + p1 (b) 將期望報酬以圖形表示,橫軸表示 p1,縱軸表示期望報酬,因為 0 ≦ p1 ≦1 ,就(a)式 當 p1 = 0 時,E1 = 4 ;當p1 = 1 時, E1 = -1,可在圖形上找出座標點,連接此兩點之直線代表 C 方採取 C1 策略時,R 方的期望報酬。同理就 (b) 式當 p1 = 0 時,E2 = 2;當 p1 = 1 時,E2 = 3,也可將 E2 在圖形上表示出,如下圖所示 依保守策略進行分析,R方採小中取大準則,其最佳選擇應該是 E 點,該點正好是 E1= 4-5p1 及 E2= 2+p1 兩條直線的交點,故 E 點由 E1 = E2 求解,即 4-5p1 = 2+p1 2 = 6p1 ∴p1 = 1/3 p2 = 1- p1 = 1 – 1/3 = 2/3 所以,R方有1/3的機率選擇 R1,2/3 的機率選擇 R2,此一選擇的期望報酬(或競賽值)為 V = 4 – 5p1 = 4 -5×1/3 = 7/3 或 V = 2 + p1 = 2 + 1/3 = 7/3 同理,C方也只有兩種策略可供選擇,使用相同的方法解C方的最佳選擇。令使用 C1 的機率為 q1,使用 C2 的機率為 q2 ,又 q1 + q2 = 1,則 q2 = 1 – q1 當 R 方採用 R1 策略時,則 C 方的期望損失為 E1 = – q1 + 3(1 – q1) = 3 – 4q1 當 R 方採用 R2 策略時,則 C 方的期望損失為 E2 = 4q1 + 2(1 – q1) = 2 + 2q1 以圖形表示如下: 依保守策略進行分析,C方採大中取小準則,其最佳選擇應該是 F 點,該點正好是 E1 = 3-4q1 及E2= 2+2q1 兩條直線的交點,故 F 點由 E1 = E2 求解。即 3 - 4q1 = 2 + 2q1 1 = 6q1 ∴q1 = 1/6 q2 = 1 – 1/6 = 5/6 所以,對 C 方而言有 1/6 的機率選擇 C1,5/6 的機率選擇 C2,此一選擇的期望損失(或競賽值)為 V = 3 – 4q1 = 3 – 4×1/6 = 7/3 或 V = 2 + 2q1 = 2 + 2×1/6 = 7/3 如果報酬表示(2×n)或(m×2),只有兩種策略可用的哪一方,當可用圖解法求解之,如 有一報酬矩陣為 公式解 當報酬表為 (2×2) 矩陣型時,有一種較簡單的解法,令報酬表為 (2×2) 矩陣,且無鞍點存在,其矩陣為

文档评论(0)

maritime5 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档