博弈模型V3.0.pptVIP

下载本文档

33
0
约1.03万字
约 43页
2017-06-23 发布于湖北
举报
版权申诉

博弈模型V3.0.ppt

1、本文档共43页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈模型V3.0

* 2. 策略集：策略：一局对策中，可供局中人选择的一个实际可行的完整的行动方案，称为一个对策。策略集:设i为局中人，i的所有策略构成的集合Si称为i的策略集。每个局中人的策略集中至少应包括两个策略。 11.4 博弈模型的基本元素 * 11.4 博弈模型的基本元素 3﹒赢得函数(支付函数)：局势：在一局对策中，各局中人所选定的策略形成的策略组称为一个局势。即若设si是第i个局中人的一个策略，则n个局中人的策略组s={s1， s2，…， sn}就是一个局势。全体局势的集合S可用各局中人策略集的笛卡尔乘积表示，即S=S1× S2×… × Sn 赢得函数：当局势出现后，对策的结果也就确定了。也就是说，对任一局势s∈S，局中人I可以得到一个赢得Hi(s)。显然， Hi(s)是局势s的函数，称之为第i局中人的赢得函数。当局中人、策略、赢得函数三个因素确定后，一个博弈模型也就给定了。 * 第11章博弈模型囚徒的困境约翰·纳什珊瑚海海战对策行为的三要素博弈模型的分类进攻与撤退的抉择 * 博弈模型静态对策动态对策结盟对策不结盟对策联合对策合作对策有限无限二人多人零和非零和零和非零和二人多人零和非零和零和非零和微分对策等重点学习 * 第11章博弈模型囚徒的困境约翰·纳什珊瑚海海战对策行为的三要素博弈模型的分类进攻与撤退的抉择 1944年6月初，盟军在诺曼底登陆成功. 到8月初的形势：背景 11.6 进攻与撤退的抉择双方应该如何决策？强化缺口盟军 (预备队) 撤退进攻德军盟军(加) 盟军(英) 盟军(美一) 盟军(美三) 东进原地待命 * 模型假设博弈参与者为两方（盟军和德军）盟军有3种使用其预备队的行动：强化缺口，原地待命，东进；德军有2种行动：向西进攻或向东撤退. 博弈双方完全理性，目的都是使战斗中己方获得的净胜场次（胜利场次减去失败场次）尽可能多. 盟军胜1场盟军败2场东进无战斗盟军胜2场原地待命无战斗盟军胜1场强化缺口向东撤退向西进攻盟军德军完全信息静态博弈共同知识(以上信息双方共有) 双方同时做出决策 * 博弈模型博弈参与者集合N={1,2}(1为盟军，2为德军) 用u1(a1，a2)表示对盟军产生的结果，即净胜场次，称为盟军的效用函数. 盟军胜1场盟军败2场东进无战斗盟军胜2场原地待命无战斗盟军胜1场强化缺口向东撤退向西进攻盟军德军盟军行动a1 A1={1,2,3}(强化缺口/原地待命/东进)；德军行动a2 A2={1,2}(进攻/撤退). (行动：即纯战略) 支付矩阵（Payoff Matrix）完全竞争: 零和博弈 (常数和博弈) u2(a1，a2)对应 –M * 博弈的解的概念：纳什均衡 (NE: Nash Equilibrium) 不存在(纯)NE (纯战略)纳什均衡 Nash: 1994年获诺贝尔经济学奖 NE: 单向改变战略不能提高自己效用，即每一方的战略对于他方的战略而言都是最优的,　称为最优反应. (纯)NE: a*=(a1*, a2*) =(2, 2) 非常数和博弈(双矩阵表示) * 混合战略（策略：Strategy) 盟军的混合战略集期望收益盟军德军 S1={p=(p1, p2, p3) |　　　　　　　　｝德军的混合战略集 S2={ q=(q1, q2) |　　　　　　　　｝完全信息　静态博弈　有限博弈　矩阵博弈 (2人)　零和博弈　常数和博弈 * 模型求解理性推理：不管自己怎么做，另一方总是希望使自己得分尽量低.　（二人零和博弈，完全竞争）盟军德军线性规划从一个给定的战略中期望得到的赢得，总是采用该策略时他们可能得到的最坏的赢得！盟军可以用min pM来衡量策略p的好坏 max U1(p) = min pM min U2(q) = max MqT 德军可以用max MqT来衡量策略q的好坏 (p*, q*): 混合(策略)纳什均衡(Mixed NE) p2*=3/5，p3*=2/5 q1*=1/5，q2*=4/5 最优值均为2/5 * 占优(dominate)：盟军的行动2占优于1 （前面的非常数和博弈M’类似）混合策略似乎不太可行! 但概率可作为参考. ----现实：盟军让预备队原地待命（行动2），而德军没有选择撤退（行动2），结果德军大败. 模型评述博弈规则至关重要的，如参与人决策的时间顺序、决策时拥有哪些信息