- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * 第五节 多重纳什均衡的筛选 如何保证纳什均衡出现? 五、抗共谋均衡 (三)抗共谋均衡的定义p119 抗共谋均衡定义;如果一个博弈的某个策略 组合满足下列 条件 ⑴ 没有任何参与人的串谋会改变 博弈的结果; ⑵ 给定选择偏离的参与人有再次 偏离的自由时,没有任何两个 参与人的串谋会改变博弈的结果; ⑶ 依次类推,直到所有参与人都参加的串谋也不会改变博弈的结果。 则称该策略组合为一个抗共谋均衡。 第五节 多重纳什均衡的筛选 如何保证纳什均衡出现? 五、抗共谋均衡 (三)抗共谋均衡的定义 集体偏离 两种集体偏离情形: 能够利益维持的集体偏离 不能利益维持的集体偏离,会产生再度偏离 金无足赤,人无完人 人总是要犯错误的,所以要对别人宽容 经得起考验的纳什均衡 在其他参与人选择了错误策略的情况下,某参与人仍能实现纳什均衡 他人不犯错误,你能实现最优;他人犯错误,你仍能实现最优 第三节多重纳什均衡的选择标准 六、颤抖手精炼均衡 Trembling-hand perfect equilibrium (一)颤抖手 某一参与人的非蓄意错误 博弈偏离均衡路径的原因 一个人用手抓东西时,手一颤抖,就可能抓不住他想抓的东西:非蓄意错误 第三节多重纳什均衡的选择标准 六、颤抖手精炼均衡 (二)颤抖手均衡 1.基本思想 给定所有参与人均可能犯错误的情况下,如果某一策略组合仍是每一个参与人的最优策略组合,则实现颤抖手均衡 如何理解? 第三节多重纳什均衡的选择标准 六、颤抖手精炼均衡 (二)颤抖手均衡 2.定义: m——mistake n人博弈中,对于每一个博弈方i,存在严格混合策略序列 ,使下列条件得到满足: (1) 尽管每一个博弈方可能犯错误,但错误收敛于零——总有一天能成功 穿针引线——功夫不负有心人 将一条线穿入针眼,手在不停颤抖,不大可能一下子穿进去 但如果试的次数足够大,总是能够成功 第三节多重纳什均衡的选择标准 六、颤抖手精炼均衡 (二)颤抖手均衡 2.定义:m——mistake n人博弈中,对于每一个博弈方i,存在严格混合策略序列 ,使下列条件得到满足: (2)对于任何可选择的混合策略 穿针引线——学会宽容 纳什均衡:每一个人都把线穿入针眼 宽容:某参与人不能因为其他参与人可能暂时无法把线穿进针眼而故意不把线穿进针眼 宽容是一种美德 练习:模型化下述划拳博弈: 两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,这个博弈有纯战略均衡吗?计算其混合战略纳什均衡。 * * * * * * * * * * * * * * * * * * * * * 第二节 混合策略纳什均衡的求解方法 二、反应对应法 例:扑克牌对色游戏(p77) 再看乙的最优反应,记为q*=R(r): 观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1) r q 0 1 (红) 1 (红) 1/2 1/2 q*=R(r) 反应对应曲线 第二节 混合策略纳什均衡的求解方法 二、反应对应法 例:扑克牌对色游戏(p77) 作为NE,各个参与人的反应应该同时为最优,只有两个反应对应的交点满足 NE:r*=1/2, q*=1/2 NE支付为: π甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0 π乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0 r q 0 1 (红) 1 (红) 1/2 1/2 q*=R(r) r*=R(q) 第二节 混合策略纳什均衡的求解方法 二、反应对应法 作业:社会福利博弈。使用反应对应法找到纳什均衡。 流浪汉 寻找工作 游荡 救济 政府 不救济 3,2 -1,3 -1,1 0,0 第三节 寻找多重纳什均衡 例:情侣博弈 两个(多个)纯策略纳什均衡 问题:纳什均衡找完了吗?有无混合策略纳什均衡? 一、支付最大化法 给定混合策略p陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r
您可能关注的文档
最近下载
- 神经系统的分级调节ppt课件.pptx VIP
- AI测试练习试题及答案.doc
- 2025广西南宁江南区“点对点”送工和乡村公岗专管员招聘2人备考练习题库及答案解析.docx VIP
- 肿瘤防治策略与最新进展.docx VIP
- 第五章植物-病原互作过程中效应子的作用.ppt VIP
- 湘科版《科学》四年级上册全册教案.doc VIP
- IEC_62893-4-1-2020 额定电压不超过 0.61 KV 的电动汽车充电电缆 – 第 4-1 部分:符合 IEC 61851‑‑1 模式 4 的直流充电电缆 – 不使用热管理系统的直流充电.pdf VIP
- 机器人集成解决方案 (机器人+).pdf VIP
- 消除艾滋病、梅毒和乙肝母婴传播项目工作制度及流程(模板).pdf
- 2025广西南宁市江南区“点对点”送工和乡村公岗专管员招聘考试备考试题及答案解析.docx VIP
文档评论(0)