赛局理论.pptVIP

下载本文档

351
0
约2.97千字
约 38页
2017-04-05 发布于上海
举报
版权申诉

赛局理论.ppt

1、本文档共38页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

赛局理论

假設參賽者採取合作（否認）的扣扳機策略，一旦某一方選擇承認（欺騙對方），則雙方在後續的賽局永遠採取承認的策略。如果雙方皆否認，則每一期的報償等於-2，於是整個重複賽局的報償期望值等於： -2(1+g+g2+g3+…) 如果某為參賽者選擇承認來欺騙對方，則欺騙者在該期的報償等於-1，但是後續的賽局雙方都採承認策略，於是後續賽局的報償等於-3，因此總報償期望值等於： -1+(-3)(g+g2+g3+…) g必須大於1/2，否認的合作策略才能維續。只有當賽局重複的機率夠高，參賽者才可能在囚犯兩難的重複賽局中採取合作策略。參賽者可能試圖欺騙對方而獲得短期的報償(-1)，但是未來的損失將阻止參賽者騙。連續行為共有財的悲劇此賽局包含A與B兩位牧羊人在共有的草原上放牧羊群。 sA與sB代表A與B兩人放牧的羊隻數目，並且是同時的選擇。假設A從每隻羊獲得的利益為：120-sA-sB 則A的總利益等於：sA ( 120-sA-sB ) A的最佳回應函數等於： B的最佳反映函數等於：此賽局稱為共有財的悲劇，是因為牧羊人過度放牧，兩人決定自己的羊隻數目時，並未考慮另一方的利益。當人們可以免費使用共有資源時，過度消費是很典型的現象。均衡的變動假設A的邊際利益上升至：132-2sA-sB 則A的最佳回應函數成為： CH04 賽局理論 Nicholson、Snyder 合著許景翔、潘明如合譯基本概念均　衡基本概念的說明複合均衡依序賽局連續行為 N位參賽者的賽局理論資訊不完全本章將專注於非合作的賽局理論，參賽者以本身的利益為決策的導向。第一，自我利益的行為未必達成整個團體最佳的結果。第二，自我利益的行為是由本書先前個人決策分析自然延伸至策略情境。第三，利用非合作的賽局理論可以分析參賽者合作的意圖。基本概念賽局理論模型是以簡化形式來描述複雜的策略情境。所有的賽局具有四項基本要素：參賽者：賽局中的每一位決策者稱為參賽者。策略：賽局中開放給參賽者選擇的行為稱為策略。報償：賽局結束後，參賽者的最終報酬稱為報償（payoffs）。資訊：為了完整地描述賽局，我們必須界定參賽者採取行為時所擁有的資訊。在同步賽局中，參賽者採取行動時都不知道對方的行為。而在連續賽局中，首先採取行動的參賽者不會知道另一參賽者的行為，但是後動者知道先行者的行為。在資訊不完全的賽局中，參賽者有機會獲得其他參賽者不了解的資訊。均衡最常用以定義賽局均衡的方法是以納許（J. Nash）命名。最佳回應（best response）是均衡的中心概念。當參賽者A採取 a* 策略時，參賽者B的最佳回應為 b*；當參賽者B採取 b* 策略時，參賽者A的最佳回應為 a*，則（ a*, b* ）是一組相互的最佳回應，這組策略稱為納許均衡（Nash equilibrium）。基本概念的說明以最知名的非合作賽局：囚犯的兩難，說明賽局的基本要素與納許均衡的概念。囚犯的兩難：優勢策略：囚犯兩難的賽局中，「承認」是對應另一參賽者均衡策略的最佳回應，亦是對應另一參賽者所有策略的最佳回應，稱之為優勢策略（dominant strategy）混合策略：單純策略是指確定地選擇一項行為。混合策略，其允許參賽者隨機選擇許多可能的行為。銅板配對：此賽局的特徵為每一結果的報償總和等於 0，稱之為零和賽局。求解混合策略的納許均衡：表4.3的四種結果出現之機率皆為1/4，則A的報償期望值等於報償以機率加權的總和： (1/4)1 ＋ (1/4) (-1) ＋ (1/4) (-1) ＋ (1/4) (-1) ＝ 0 同樣的，B的報償期望值也等於0。如果沒有一方改變策略可以產生大於0的報償，則此混合策略為彼此的最佳回應。雙方以同等的機率選擇正面與反面，是唯一的混合策略納許均衡。複合均衡所有賽局都有納許均衡，其中有些賽局卻有許多納許均衡（即複合均衡）。複合均衡對試圖利用賽局理論預測結果的經濟學家而言是個難題，因為不易預測到底會發生哪一個納許均衡。囚犯的兩難：複合均衡所有賽局都有納許均衡，其中有些賽局卻有許多納許均衡（即複合均衡）。複合均衡對試圖利用賽局理論預測結果的經濟學家而言是個難題，因為不易預測到底會發生哪一個納許均衡。囚犯的兩難計算兩性戰爭的混合策略：令w代表太太選擇芭蕾的機率，h代表先生選擇芭蕾的機率。我們的目標是計算w與h的均衡值。最佳回應函數：參賽者報償