混合策略纳许均衡课件.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

ISBN957-729-568-1第八章混合策略納許均衡

本章大綱ISBN957-729-568-1q8.1棒球賽中的投手與打者之戰q8.2純策略與混合策略的納許均衡q8.3特價活動q8.4混合策略與純策略均衡並存q8.5以圖形分析混合策略

本章觀念預讀ISBN957-729-568-1q純策略:純策略是指於標準式中表述之各列與各行伴隨報酬的策略。q混合或隨機策略:混合策略就是賦予標準式中的純策略一機率分配。q混合策略均衡:若一納許均衡中,有一參賽者的策略是混合策略,則此均衡即稱之為混合策略均衡。

棒球賽中的投手與打者之戰ISBN957-729-568-1q理性的假設下,投手與打者將選擇不可測的策略l不可測的策略:參賽者選擇的是一純策略的機率分配,又稱為混和策略。l純策略就是表述在標準式中的策略,混合策略就是賦予標準式中的純策略一機率分配。q混合策略納許均衡兩階段思考l打者先決定是否採取隨機策略l選擇特定的機率

表8.1棒球投手與打者之報酬表ISBN957-729-568-1

表8.2打者不同策略下的期望報酬ISBN957-729-568-1

表8.3投手不同策略下的期望報酬ISBN957-729-568-1

表8.4各種機率選擇下的期望報酬ISBN957-729-568-1

重要觀念顯微鏡ISBN957-729-568-1q當對手採取的隨機策略使你無論採取哪一個策略都得到相同的報酬時,你選擇哪一個策略都一樣。q理性的共有知識:不僅兩個參賽者是理性的,而且彼此都知道對手是理性的。q貝氏學習法則:根據更新的資訊來修正經驗l參賽者認為對手並非全然理性時,無法推論對手的策略為何,僅能根據經驗估測對手採取某純策略的機率

純策略與混合策略的納許均衡ISBN957-729-568-1q純策略是指表述於標準式中各列與各行伴隨報酬的策略,而混合策略是指賦予多個純策略以一特定的機率分配。q馮紐曼與摩根斯坦證明兩人零和賽局的均衡必定存在q納許證明所有兩人賽局必存在納許均衡

特價活動ISBN957-729-568-1q零售商的策略l今日特價l明日特價q消費者的策略l今日購物l明日購物q納許均衡可能是混合策略的組合

表8.5特價活動賽局的報酬ISBN957-729-568-1

表8.6零售商不同策略下的期望報酬ISBN957-729-568-1

表8.7消費者不同策略下的期望報酬ISBN957-729-568-1

混合策略與純策略均衡並存ISBN957-729-568-1q阿羅與喬治互讓的賽局l等候l前進l三個均衡,包括兩個純策略均衡以及一個混合策略均衡q利特頓鎮與哈姆雷特鎮的鑿井策略l鑿淺井l鑿深井

表8.8阿羅與喬治的報酬ISBN957-729-568-1

表8.9阿羅採取不同策略下的期望報酬ISBN957-729-568-1

表8.10在混合策略均衡下,阿羅採取不同策略的期望報酬ISBN957-729-568-1

表8.11利特頓鎮與哈姆雷特鎮的報酬ISBN957-729-568-1

表8.12利特頓鎮的期望報酬ISBN957-729-568-1

以圖形分析混合策略ISBN957-729-568-1q以棒球賽投手與打者的賽局為例l只有當投手與打者都採取混合策略時,才會是納許均衡。q以阿羅與喬治的互讓賽局為例l混合策略是不穩定的l一般情形下,一賽菊若有兩個純策略均衡與混合一個策略均衡,此混合策略均衡也經常是不穩定的q以廣告賽局為例l當我們擴大參賽者的可選擇策略集合至混合策略時,社會困境均衡仍可能是一優勢策略均衡。

圖8.1棒球中打者的期望報酬ISBN957-729-568-1

圖8.2阿羅與喬治的期望報酬ISBN957-729-568-1

表8.13廣告賽局(複製自表1.3)ISBN957-729-568-1

圖8.3廣告賽局的期望報酬ISBN957-729-568-1

本章摘要ISBN957-729-568-1q不確定性可能來自於「自然」,也可能是人類的選擇。在賽局標準式中,兩側的策略稱為純策略。而當參賽者使用純策略時,很容易會被看穿,進而陷入脆弱的地位。因此,參賽者為使策略不可測,可賦予純策略某一機率分配,即為混合策略。q因為策略是不確定的,只能以期望報酬來加以評量報酬,因此,參賽者的最適反應就是選擇一個可以極大化期望報酬的機率分配。按此,所有兩人賽局皆有納許均衡,縱使賽局沒有純策略均衡,也一定會有混合策略均衡。在某些賽局(如協調賽局)中,會同時存在純策略與混合策略均衡,但是,混合策略均衡在這些賽局裡是不穩定的。

文档评论(0)

139****0945 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档