博弈模型V3.0.pptVIP

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈模型V3.0

* 2. 策略集: 策略:一局对策中,可供局中人选择的一个实际可行的完整的行动方案,称为一个对策。 策略集:设i为局中人,i的所有策略构成的集合Si称为i的策略集。每个局中人的策略集中至少应包括两个策略。 11.4 博弈模型的基本元素 * 11.4 博弈模型的基本元素 3﹒赢得函数(支付函数): 局势:在一局对策中,各局中人所选定的策略形成的策略组称为一个局势。即若设si是第i个局中人的一个策略,则n个局中人的策略组s={s1, s2,…, sn}就是一个局势。 全体局势的集合S可用各局中人策略集的笛卡尔乘积表示,即S=S1× S2×… × Sn 赢得函数:当局势出现后,对策的结果也就确定了。也就是说,对任一局势s∈S,局中人I可以得到一个赢得Hi(s)。显然, Hi(s)是局势s的函数,称之为第i局中人的赢得函数。 当局中人、策略、赢得函数三个因素确定后,一个博弈模型也就给定了。 * 第11章 博弈模型 囚徒的困境 约翰·纳什 珊瑚海海战 对策行为的三要素 博弈模型的分类 进攻与撤退的抉择 * 博弈模型 静态对策 动态对策 结盟对策 不结盟对策 联合对策 合作对策 有限 无限 二人 多人 零和 非零和 零和 非零和 二人 多人 零和 非零和 零和 非零和 微分对策等 重点学习 * 第11章 博弈模型 囚徒的困境 约翰·纳什 珊瑚海海战 对策行为的三要素 博弈模型的分类 进攻与撤退的抉择 1944年6月初,盟军在诺曼底登陆成功. 到8月初的形势: 背景 11.6 进攻与撤退的抉择 双方应该如何决策 ? 强化缺口 盟军 (预备队) 撤退 进攻 德军 盟军(加) 盟军(英) 盟军(美一) 盟军(美三) 东进 原地 待命 * 模型假设 博弈参与者为两方(盟军和德军) 盟军有3种使用其预备队的行动:强化缺口,原地待命,东进;德军有2种行动:向西进攻或向东撤退. 博弈双方完全理性,目的都是使战斗中己方获得的净胜场次(胜利场次减去失败场次)尽可能多. 盟军胜1场 盟军败2场 东进 无战斗 盟军胜2场 原地待命 无战斗 盟军胜1场 强化缺口 向东撤退 向西进攻 盟军 德军 完全信息静态博弈 共同知识(以上信息双方共有) 双方同时做出决策 * 博弈模型 博弈参与者集合N={1,2}(1为盟军,2为德军) 用u1(a1,a2)表示对盟军产生的结果,即净胜场次,称为盟军的效用函数. 盟军胜1场 盟军败2场 东进 无战斗 盟军胜2场 原地待命 无战斗 盟军胜1场 强化缺口 向东撤退 向西进攻 盟军 德军 盟军行动a1 A1={1,2,3}(强化缺口/原地待命/东进); 德军行动a2 A2={1,2}(进攻/撤退). (行动:即纯战略) 支付矩阵 (Payoff Matrix) 完全竞争: 零和博弈 (常数和博弈) u2(a1,a2)对应 –M * 博弈的解的概念:纳什均衡 (NE: Nash Equilibrium) 不存在(纯)NE (纯战略)纳什均衡 Nash: 1994年获诺贝尔经济学奖 NE: 单向改变战略不能提高自己效用,即每一方的战略对于他方的战略而言都是最优的, 称为最优反应. (纯)NE: a*=(a1*, a2*) =(2, 2) 非常数和博弈(双矩阵表示) * 混合战略(策略:Strategy) 盟军的混合战略集 期望收益 盟军 德军 S1={p=(p1, p2, p3) |        } 德军的混合战略集 S2={ q=(q1, q2) |        } 完全信息 静态博弈  有限博弈 矩阵博弈 (2人)  零和博弈 常数和博弈 * 模型求解 理性推理:不管自己怎么做,另一方总是希望使自己得分尽量低. (二人零和博弈,完全竞争) 盟军 德军 线性规划 从一个给定的战略中期望得到的赢得,总是采用该策略时他们可能得到的最坏的赢得! 盟军可以用min pM来衡量策略p的好坏 max U1(p) = min pM min U2(q) = max MqT 德军可以用max MqT来衡量策略q的好坏 (p*, q*): 混合(策略)纳什均衡(Mixed NE) p2*=3/5,p3*=2/5 q1*=1/5,q2*=4/5 最优值均为2/5 * 占优(dominate):盟军的行动2占优于1 (前面的非常数和博弈M’类似) 混合策略似乎不太可行! 但概率可作为参考. ----现实:盟军让预备队原地待命(行动2),而德军没有选择撤退(行动2),结果德军大败. 模型评述 博弈规则至关重要的,如参与人决策的时间顺序、决策时拥有哪些信息

文档评论(0)

dajuhyy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档