赛局理论.pptVIP

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
赛局理论

假設參賽者採取合作(否認)的扣扳機策略,一旦某一方選擇承認(欺騙對方),則雙方在後續的賽局永遠採取承認的策略。 如果雙方皆否認,則每一期的報償等於-2,於是整個重複賽局的報償期望值等於: -2(1+g+g2+g3+…) 如果某為參賽者選擇承認來欺騙對方,則欺騙者在該期的報償等於-1,但是後續的賽局雙方都採承認策略,於是後續賽局的報償等於-3,因此總報償期望值等於: -1+(-3)(g+g2+g3+…) g必須大於1/2,否認的合作策略才能維續。 只有當賽局重複的機率夠高,參賽者才可能在囚犯兩難的重複賽局中採取合作策略。 參賽者可能試圖欺騙對方而獲得短期的報償(-1),但是未來的損失將阻止參賽者騙。 連續行為 共有財的悲劇 此賽局包含A與B兩位牧羊人在共有的草原上放牧羊群。 sA與sB代表A與B兩人放牧的羊隻數目,並且是同時的選擇。 假設A從每隻羊獲得的利益為:120-sA-sB 則A的總利益等於:sA ( 120-sA-sB ) A的最佳回應函數等於: B的最佳反映函數等於: 此賽局稱為共有財的悲劇,是因為牧羊人過度放牧,兩人決定自己的羊隻數目時,並未考慮另一方的利益。 當人們可以免費使用共有資源時,過度消費是很典型的現象。 均衡的變動 假設A的邊際利益上升至:132-2sA-sB 則A的最佳回應函數成為: CH04 賽局理論 Nicholson、Snyder 合著 許景翔、潘明如 合譯 基本概念 均 衡 基本概念的說明 複合均衡 依序賽局 連續行為 N位參賽者的賽局理論 資訊不完全 本章將專注於非合作的賽局理論,參賽者以本身的利益為決策的導向。 第一,自我利益的行為未必達成整個團體最佳的結果。 第二,自我利益的行為是由本書先前個人決策分析自然延伸至策略情境。 第三,利用非合作的賽局理論可以分析參賽者合作的意圖。 基 本 概 念 賽局理論模型是以簡化形式來描述複雜的策略情境。所有的賽局具有四項基本要素: 參賽者:賽局中的每一位決策者稱為參賽者。 策 略:賽局中開放給參賽者選擇的行為稱為策 略。 報 償:賽局結束後,參賽者的最終報酬稱為報 償(payoffs)。 資 訊:為了完整地描述賽局,我們必須界定參 賽者採取行為時所擁有的資訊。在同步 賽局中,參賽者採取行動時都不知道對 方的行為。而在連續賽局中,首先採取 行動的參賽者不會知道另一參賽者的行 為,但是後動者知道先行者的行為。在 資訊不完全的賽局中,參賽者有機會獲 得其他參賽者不了解的資訊。 均 衡 最常用以定義賽局均衡的方法是以納許(J. Nash)命名。 最佳回應(best response)是均衡的中心概念。 當參賽者A採取 a* 策略時,參賽者B的最佳回應為 b*;當參賽者B採取 b* 策略時,參賽者A的最佳回應為 a*,則( a*, b* )是一組相互的最佳回應,這組策略稱為納許均衡(Nash equilibrium)。 基本概念的說明 以最知名的非合作賽局:囚犯的兩難,說明賽局的基本要素與納許均衡的概念。 囚犯的兩難: 優勢策略: 囚犯兩難的賽局中,「承認」是對應另一參賽者均 衡策略的最佳回應,亦是對應另一參賽者所有策略 的最佳回應,稱之為優勢策略(dominant strategy) 混合策略: 單純策略是指確定地選擇一項行為。 混合策略,其允許參賽者隨機選擇許多可能的行為。 銅板配對: 此賽局的特徵為每一結果的報償總和等於 0,稱之為零和賽局。 求解混合策略的納許均衡: 表4.3的四種結果出現之機率皆為1/4,則A的報償期望值等於報償以機率加權的總和: (1/4)1 + (1/4) (-1) + (1/4) (-1) + (1/4) (-1) = 0 同樣的,B的報償期望值也等於0。如果沒有一方改變策略可以產生大於0的報償,則此混合策略為彼此的最佳回應。 雙方以同等的機率選擇正面與反面,是唯一的混合策略納許均衡。 複合均衡 所有賽局都有納許均衡,其中有些賽局卻有許多納許均衡(即複合均衡)。複合均衡對試圖利用賽局理論預測結果的經濟學家而言是個難題,因為不易預測到底會發生哪一個納許均衡。 囚犯的兩難: 複合均衡 所有賽局都有納許均衡,其中有些賽局卻有許多納許均衡(即複合均衡)。複合均衡對試圖利用賽局理論預測結果的經濟學家而言是個難題,因為不易預測到底會發生哪一個納許均衡。 囚犯的兩難 計算兩性戰爭的混合策略: 令w代表太太選擇芭蕾的機率,h代表先生選擇芭蕾的機率。 我們的目標是計算w與h的均衡值。 最佳回應函數:參賽者報償

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档