三、智猪博弈.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
三、智猪博弈

智猪博弈 –以不变应万变 3.1 博弈论要点 博弈论的基本概念包括:参与人、行动、信息、战略、支付函数、结果、均衡 其中,参与人、行动、结果合称博弈规则 博弈有不同的种类: 从行动顺序角度: 静态博弈。参与人同时选择行动 动态博弈。参与人的行动有先后顺序 3.1 博弈论要点 从拥有信息角度: 完全信息博弈。每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识 不完全信息博弈。 将二角度结合,博弈有四种: 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈 博弈论模型G={P,A,S,I,U} 一个博弈需要有五方面内容组成:参与人、行动、信息、结果 P:为局中人,能够独立决策,独立承担责任的个人或组织,以最终实现自身利益最大化为目标。 A:各局中人的所有可能的策略或行动的集合。分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等。 S:博弈的进程或次序。分为静态博弈和动态博弈。 I:博弈信息,能够影响最后博弈结局的所有局中人的情报。信息在博弈中占重要地位,博弈的赢得很大程度上依赖于信息的准确度与多寡。如果各方对各种局势下所有局中人的得益状况完全清楚,称为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈。反之称为“不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。 U:为局中人获得利益,也是博弈各方追求的最终目标。分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。 3.2 完全信息静态博弈:纳什均衡 设有两个人一起玩游戏,每个人都有不同的策略,谁都希望自己出“高招”使自己获胜(即寻求效用的最大化),但获胜并不完全依赖于自己的行为能力,还依赖于对手怎么做。 有时,双方会形成这样一种状态:我的最好策略所依赖的条件就是你的最好策略。换言之:如果你那样做,我这样最好,而你“那样”做恰恰又是你的最佳策略。 通俗地讲:如果别人不动,我也不能动 3.2 完全信息静态博弈:纳什均衡 假设n个人参与博弈,给定其他人战略的条件下,每个人选择自己的最优战略。纳什均衡指的是“由所有参与人的最优战略组成的一个组合” 几个人制订了一个协议,这几个人是否能自愿遵守?他们会自觉遵守,这个协议就构成一个纳什均衡。 如果一个协议不构成纳什均衡,它就不可能自动实施,需要外力胁迫,这就无所谓“协议” 3.2 完全信息静态博弈: 纳什均衡基本分析思路和方法 占优战略均衡:不论其他人采取什么策略,A之某策略的payoff总是最高,即为“占优战略” 如果一个博弈的某个策略组合中的所有策略都是各方的上策,那么这个策略组合将是所有人都愿意选择的,必然是比较稳定的结果,这是“占优战略均衡” 。反映了所有人的绝对偏好,因此十分稳定。但这种情况较少见。 划线法:横向,如果“列”选中一个策略,在我的最佳策略下划线;纵向,如果“行”选中一个策略,在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线,此即较为可能的解。如果这种解只有一组,此即上策均衡。 3.3 智猪博弈 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。  假设猪圈里有一头大猪、一头小猪。若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下, 如何选择进食方式? “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 下表给出这个博弈的支持矩阵 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 综合来看,无论大猪是选择行动还是等待,小猪的选择都 将是等待,即等待是小猪的占优策略。    智猪博弈的结果 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。   现在来看大猪。由于小

文档评论(0)

yaocen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档