马可夫链与赛局理论.ppt

  1. 1、本文档共116页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
马可夫链与赛局理论

* 例題 1 唐先生和聶小姐一起玩錢幣配對遊戲,其支付額矩陣如下(唐先生視為行參賽者,聶小姐視為列參賽者): 以下若聶小姐採用P的混合策略,而唐先生採用Q的混合策略,試求賽局的期望支付額: Tan/管理數學 第7章 第394頁 與 與 * 例題 1(續) 解: a. 由公式計算得  因此,在重複的賽局下,從長期看,雙方並沒有  輸贏。 Tan/管理數學 第7章 第394頁 * 例題 1(續) 解(續): b. 由公式計算得  因此,在重複的賽局下,從長期看,對列參賽者  (聶小姐) 而言,每一回比賽平均將輸掉1.06元。 Tan/管理數學 第7章 第394頁 * 例題 2 一賽局的支付額矩陣如下: a. 如果列參賽者採用極小值最大化策略,且行參賽者採用極大值最小化策略,試問對列參賽者而言,期望支付額為多少? b. 如果列參賽者採用極小值最大化策略的機會為50%,選擇其餘兩列的機會各為25%,且行參賽者選擇各行的機會分別為50%,試問對列參賽者而言,期望支付額為多少? Tan/管理數學 第7章 第395頁 * 例題 2(續) 解: a. 我們利用第7.4節的方法,尋找極小值最大化策略與極大值最小化策略如下:   Tan/管理數學 第7章 第395頁 * 例題 2(續) 解 a(續): 列參賽者的最佳單一策略是選擇第二列,而行參賽者的最佳單一策略是選擇第二行。如果兩位參賽者都採用上述的最佳單一策略,則從支付額矩陣的第二列第二行元素可知,賽局的期望支付額為支付給列參賽者2元。 Tan/管理數學 第7章 第395頁 * 例題 2(續) 解(續): b. 根據題意,可寫出列參賽者的混合策略為  行參賽者的混合策略為 Tan/管理數學 第7章 第395頁 * 例題 2(續) 解 b(續): 由公式計算,支付給列參賽者的期望支付額為 Tan/管理數學 第7章 第395-396頁 * Tan/管理數學 第7章 第396-397頁 賽局的期望值 2 × 2非嚴格判定賽局的最佳混合策略 令 為一非嚴格判定賽局的支付額矩陣。則對列參賽者而言, 其最佳混合策略是 (2a) 其中 * Tan/管理數學 第7章 第397頁 賽局的期望值 對行參賽者而言,其最佳混合策略是 (2b) 其中 * 賽局的期望值 Tan/管理數學 第7章 第397頁 此外,當P與Q分別是列與行參賽者的最佳混合策略時,賽局值定義成此賽局的期望值E = PAQ,即 (2c) * 例題 3 錢幣配對遊戲 依照例題1 的支付額矩陣: a. 找出唐先生與聶小姐二人的最佳混合策略。 b. 計算賽局值,並判斷此賽局是否對誰較為有利? Tan/管理數學 第7章 第397頁 * 例題 3 錢幣配對遊戲(續) 解: a. 由於此支付額矩陣沒有鞍點,因此這是一個非嚴格判定賽局。將a = 3, b = ?2, c = ?2 與d = 1 代入公式(2a): Tan/管理數學 第7章 第397頁 * 例題 3 錢幣配對遊戲(續) 解 a(續): 故知聶小姐的最佳混合策略為 Tan/管理數學 第7章 第398頁 * 例題 3 錢幣配對遊戲(續) 解 a(續): 利用公式(2b): Tan/管理數學 第7章 第398頁 * 例題 3 錢幣配對遊戲(續) 解 a(續): 得知唐先生的最佳混合策略是 Tan/管理數學 第7章 第398頁 * 例題 3 錢幣配對遊戲(續) Tan/管理數學 第7章 第398頁 解(續): b. 利用公式(2c)可計算出賽局值:  由於賽局值為負,所以,此賽局對唐先生較為有利。當唐   先生與聶小姐都採取最佳混合策略,在重複的賽局下,從   長期看,平均一回唐先生將贏1/8 元。 * 例題 4 投資策略 連家共有4萬元在股票及貨幣市場進行短期投資,其投資的績效視優惠利率的情況而定。如優惠利率上升,將有利於貨幣市場的投資;如優惠利率下降,則利於股票市場的投資。今將連家視為列參賽者,把不同情形下估算的投資報酬率(%)當作支付額,整理出支付額矩陣如下: Tan/管理數學 第7章 第399頁 * 例題 4 投資策略(續) a. 對於連家這筆4 萬元的短期投資,其最佳投資策 略為何? b. 連家的這項短期投資,利潤如何? Tan/管理數學 第7章 第399頁 * 例題 4 投資策略(續) 解: a. 由支付額矩陣可知,此為非嚴格判定賽局。令P = [p1 p2] 代表連家的最佳混合策略,利用公式(2a),解得 Tan/管理數學 第7章 第399頁 * 例題 4 投資策略(續) 解

您可能关注的文档

文档评论(0)

dlhss + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档