- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
经济博弈与论第五讲
第五讲混合策略和混合策略纳什均衡 5.1 严格竞争博弈和混合策略的引进 没有纳什均衡策略组合,无法用前述纳什均衡概念分析的博弈问题: 盖硬币方 避免自己的选择带有规律性 如果你选择出正面的概率为p,则出反面的概率就是1-p,出正面多于出反面,意思味着p1/2,对方如果全猜正面,则他的期望利益为:p*1+(1-P)*(-1)=2p-10 最可靠的方法是以相同的概率随机出正面和反面即取p=1/2 很显然,双方都以1/2的概率随机选择正面、反面时,双方都无法根据对方的选择方式,调整自己的策略或选择方式获得利益。 双方可选策略随机选择概率达到了稳定(均衡) 混合策略: 博弈方以一定的概率分布在可选策略中随机选择的决策方式。 在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 纯策略也可以看成混合策略,纳什均衡策略组合中的策略选择概率为1,其他策略的选择概率为0。 在混合策略的意义上定义纳什均衡:任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布,都不能给自己增加任何利益。 策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6 确定性选择的策略称“纯策略”双方都以1/6的相同概率随机选择各自的六个纯策略,构成本博弈的唯一的混合策略纳什均衡。齐威王的期望得益?田忌的期望得益? 田忌赛马 1994年经济学诺贝尔奖得主之一的塞尔顿教授。不存在纯策略纳什均衡。守卫睡策略的期望得益为:S(1-pt)+(-D)pt 小偷和守卫的博弈 小偷和守卫的博弈 5.2 多重均衡博弈和混合策略 夫妻之争的混合策略纳什均衡 在经济活动中有许多与夫妻之争相似的博弈问题。电器往往有不同的原理或相关技术标准(制式),如果厂商采用相同制式,对于推广各自的产品很有帮助。设有两个厂商同时计划收进生产线,有A、B两种不同制式。 制式问题 市场机会博弈 5.3 混合策略和严格下策反复消去法 在包括混合策略的情况下,关于严格下策反复消去法的结论仍然成立。 任何博弈方都不会采用任何严格下策;严格下策反复消去法不会消去任何纳什均衡;如果经过反复消去后留下的策略组合是唯一的,那么一定是纳什均衡。 不论是纯策略还是混合策略 不管博弈方2采用哪种策略,包括所有可能的纯策略和所有的混合策略,博弈方1混合策略(1/2,1/2,0)的期望利益始终为3/2,都大于采用D策略时能得到的确定性收益1 消去D策略后的得益矩阵 此时,L策是博弈方2的相对于R的严格下策,也可以将它从博弈方2的策略空间中消去。 纳什均衡为(M,R) 5.4混合策略反应函数 * * -1, 1 1, -1 1, -1 -1, 1 正 面 反 面 猜硬币方 盖 硬 币 方 正 面 反 面 取胜关键:①不能让另一方猜到自己的策略 ②尽可能猜出对方策略 各博弈方必须保证自身策略选择的随机性; 重视各个策略的概率分布 2, 3 5, 2 3, 1 1, 5 C D A B 博弈方2 博 弈 方 1 博弈方1的混合策略 博弈方2的混合策略 不存在纯策略均衡。决策时利用随机性; 选择每种策略的概率要恰好使对方无机可乘。 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下 上中下 上中下 上中下 上中下 上中下 上 中 下 上 中 下 上 中 下 上 中 下 上 中 下 上 中 下 田忌 齐 威 王 得益矩阵 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 加重对守卫的处罚:短期效果是使守卫更尽职 但长期中并不是使守卫更尽职,而是会降低盗窃发生的概率 0 - D - D’ 守卫 得益((睡) S Pt 小偷 偷的概率 1 p* p*’ V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能
您可能关注的文档
- 纸巾传媒与运作方式 .ppt
- 线性代数与 1.3按行(列)展开 .ppt
- 线性代数与 3-1 .ppt
- 线代课件与§5 二次型及其标准形 .ppt
- 线性代数与 chapter6 .ppt
- 线性代数与 克拉默法则 专题 .ppt
- 线性代数与 同济五版3-1 .ppt
- 线性代数与 Ⅳ.Ⅱ .ppt
- 线性代数与 河北工业大学 .ppt
- 线性代数与 二 向量空间BY徐婧 .ppt
- 2025年方便食品行业健康化产品冷链物流报告.docx
- 2025年茶饮料消费升级品牌竞争格局分析报告.docx
- 2025年超声波传感器智能穿戴检测报告.docx
- 2026届广西壮族自治区百色市田阳县田阳高中物理高二第一学期期中统考试题含解析.doc
- 2025年新能源太阳能热发电并网技术发展报告.docx
- 2025年新能源智能电网行业发展趋势及技术创新分析报告.docx
- 2025年医疗机器人十年发展:手术机器人产业链报告.docx
- 2025年挪威海洋工程产业技术突破与市场报告.docx
- 手持电动工具安全检查及维护手册.docx
- 辽宁省清原中学2026届物理高三第一学期期末统考模拟试题含解析.doc
原创力文档


文档评论(0)