三、智猪博弈.pptVIP

下载本文档

224
0
约4.4千字
约 25页
2017-06-26 发布于湖北
举报
版权申诉

三、智猪博弈.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

三、智猪博弈

智猪博弈 –以不变应万变 3.1 博弈论要点博弈论的基本概念包括：参与人、行动、信息、战略、支付函数、结果、均衡其中，参与人、行动、结果合称博弈规则博弈有不同的种类：从行动顺序角度：静态博弈。参与人同时选择行动动态博弈。参与人的行动有先后顺序 3.1 博弈论要点从拥有信息角度：完全信息博弈。每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识不完全信息博弈。将二角度结合，博弈有四种：完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈博弈论模型G＝｛P，A，S，I，U｝一个博弈需要有五方面内容组成：参与人、行动、信息、结果 P：为局中人，能够独立决策，独立承担责任的个人或组织，以最终实现自身利益最大化为目标。 A：各局中人的所有可能的策略或行动的集合。分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等。 S：博弈的进程或次序。分为静态博弈和动态博弈。 I：博弈信息,能够影响最后博弈结局的所有局中人的情报。信息在博弈中占重要地位,博弈的赢得很大程度上依赖于信息的准确度与多寡。如果各方对各种局势下所有局中人的得益状况完全清楚,称为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈。反之称为“不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。 U：为局中人获得利益,也是博弈各方追求的最终目标。分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系，争取双赢的局面。 3.2 完全信息静态博弈：纳什均衡设有两个人一起玩游戏，每个人都有不同的策略，谁都希望自己出“高招”使自己获胜(即寻求效用的最大化)，但获胜并不完全依赖于自己的行为能力，还依赖于对手怎么做。有时，双方会形成这样一种状态：我的最好策略所依赖的条件就是你的最好策略。换言之：如果你那样做，我这样最好，而你“那样”做恰恰又是你的最佳策略。通俗地讲：如果别人不动，我也不能动 3.2 完全信息静态博弈：纳什均衡假设n个人参与博弈，给定其他人战略的条件下，每个人选择自己的最优战略。纳什均衡指的是“由所有参与人的最优战略组成的一个组合” 几个人制订了一个协议，这几个人是否能自愿遵守？他们会自觉遵守，这个协议就构成一个纳什均衡。如果一个协议不构成纳什均衡，它就不可能自动实施，需要外力胁迫，这就无所谓“协议” 3.2 完全信息静态博弈：纳什均衡基本分析思路和方法占优战略均衡：不论其他人采取什么策略，A之某策略的payoff总是最高，即为“占优战略” 如果一个博弈的某个策略组合中的所有策略都是各方的上策，那么这个策略组合将是所有人都愿意选择的,必然是比较稳定的结果,这是“占优战略均衡” 。反映了所有人的绝对偏好，因此十分稳定。但这种情况较少见。划线法：横向，如果“列”选中一个策略，在我的最佳策略下划线；纵向，如果“行”选中一个策略，在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线，此即较为可能的解。如果这种解只有一组，此即上策均衡。 3.3 智猪博弈猪圈很长，一头有一踏板，另一头是饲料的出口和食槽。猪每踩一下踏板，另一边就会有相当于10份的猪食进槽，但是踩踏板以后跑到食槽所需要付出的“劳动”，加起来要消耗相当于2份的猪食。　假设猪圈里有一头大猪、一头小猪。若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，如何选择进食方式？ “笼中猪”博弈的具体情况如下：如果两只猪同时踩踏板，同时跑向食槽，大猪吃进7份，得益5份，小猪吃进3份，实得1份；如果大猪踩踏板后跑向食槽，这时小猪抢先，吃进4份，实得4份，大猪吃进6份，付出2份，得益4份；如果大猪等待，小猪踩踏板，大猪先吃，吃进9份，得益9份，小猪吃进1份，但是付出了2份，实得-1份；如果双方都懒得动，所得都是0。下表给出这个博弈的支持矩阵用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择：综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即等待是小猪的占优策略。　　智猪博弈的结果利益分配格局决定两头猪的理性选择：小猪踩踏板只能吃到一份，不踩踏板反而能吃上4份。对小猪而言，无论大猪是否踩动踏板，小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边，这是最好的选择。　　现在来看大猪。由于小