网站大量收购闲置独家精品文档,联系QQ:2885784924

王则柯-博弈论教程(四版)6第四章 序贯决策博弈.pptxVIP

王则柯-博弈论教程(四版)6第四章 序贯决策博弈.pptx

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 序贯决策博弈;4-1 序贯决策博弈与博弈树 4-2 策略与行动 4-3 序贯博弈的纳什均衡 4-4 倒推法 4-5 先动优势与后动优势 4-6 博弈论给自己出难题;扩展式表述;扩展式表述;博弈的扩展式表述可以用博弈树来实现 博弈树的特点是直观清晰,其优点是可以体现多人博弈过程 举例:以房地产开发为例 参与人是A、B A先行,然后是自然选择市场大小,最后B行动 自然选择的概率分布为:市场需求大的概率为1/2,需求小的概率1/2。;;决策有先后的博弈,称为序贯决策博弈(序贯博弈)。表述为博弈树的博弈,也叫做展开型表示的博弈。 博弈树描述了所有局中人可以采取的所有可能的行动以及博弈的所有可能的结果。 博弈树由节点(nodes)和棱(edges)组成,节点又分为决策节点(decision nodes)和末端节点(terminal nodes)。 博弈树以棱把节点连接起来。;决策节点是局中人作出决策的地方。每个决策节点都与一个在该决策节点上进行决策的局中人相对应。 每棵博弈树都有一个初始决策节点,初始决策节点也叫做博弈树的根(root),是博弈开始的地方。 末端节点是博弈结束的地方,一个末端节点就是博弈的一个(可能的)结果(outcome)。; 每一个末端节点,都与一个支付向量相对应,这个向量按分量次序排列博弈的所有参与人在这个结果下的博弈所得。博弈的参与人的数目,就是支付向量的维数。 首次行动顺序原则:序贯博弈各结果相应的支付向量中,按照每个参与人头一次决策行动出现先后的自然次序排列收益。;博弈树必须说明在每一个决策节点上相应的局中人能够采取的所有可能的选择。 一些博弈树可能包含“不做任何决策”的决策节点。每一个决策节点都有至少一条棱从它那里出发往后延伸,但是没有最大延伸数量的限制。 对于不是根的每个节点,只能有来自别的节点的唯一的棱指向它这个节点。;博弈树并不要求每个局中人必须在至少一个非末端节点上进行决策。即,可能会出现某些局中人并不在任何一个非末端节点上进行决策的情形。 ;进入障碍博弈;n人序贯博弈的博弈树的主要特征;注意几点: 首先,末端节点并不为任何一个局中人所单独拥有,末端节点按照一定次序给出所有局中人在这个结果的博弈所得,约定采用首次行动顺序原则给出这个次序。 博弈树并不要求每个局中人必须在至少一个非末端节点上进行决策。在一个多人序贯博弈中,可能会出现某些局中人并不在任何一个非末端节点上进行决策的情形。这些局中人因为没有行动的机会,实际上并不参与博弈,我们仍然把他们称为博弈的局中人或者参与人,他们实际上是别人的博弈后果的承受者。 博弈树允许从一个非末端节点只伸延出一个棱的情况,在这种情况下,这个非末端节点就是一个实际上不做决策的决策节点。;4-2 策略与行动;序贯决策博弈;“进入者”只有一个决策节点,他有两个纯策略可以选择:进入和不进入。;男策略:足球;芭蕾 女策略: 追随策略:他选择什么,我就选择什么; 对抗策略:他选择什么,我就偏不选什么; 芭蕾策略:无论他选什么,我都选我喜欢的芭蕾; 足球策略:无论他选什么,我都选他喜欢的足球;女方策略:;八种可能的策略组合;粗线表示法;箭头排除确定法;均衡与结果;同时决策博弈中,由于“策略”选择等同于“行动”选择,所以那时候说“均衡”与说“结果”没有多少不同。 至于符号方面,表示策略组合用圆括号,表示结果也用圆括号,但表示策略组合的圆括号里面的各项是策略,(理应)用花括号括住,而表示结果的圆括号里面的各项是行动,不该用花括号括住。;练习;策略组合;策略组合星号简示法 : ( U ,{ U’ , * } )2 策略组合的节点表示法: ( { U / D }, { U’ / D’ , U’’ / D’’ })8;4-4 倒推法(逆向推导法);一般步骤;由于倒推法确定的各个局中人在各阶段的选择,都建立在后续阶段各个局中人理性选择的基础上,因而很自然就排除了包含不可置信威胁或承诺的可能性,因此它得到的结论比较可靠,并且由此确定下来的各个局中人的策略组合,具有较好的稳定性。 事实上,倒推法是序贯博弈中使用得最普遍的方法,它对于分析完全并且完美信息的序贯博弈非常有用。;4-5 先动优势与后动优势; 局中人后行动得益大于先行动得益的情况,叫做后动优势。 “后下手也不一定遭殃”: eg.最优的制度; 两商家确定价格;甲有后动优势;甲有先动优势,乙有后动优势;4-6 博弈论给自己出难题;难题1:100元的分配;难题2:抓钱博弈(蜈蚣博弈);难题3:旅行者困境

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档