4.扩展式博弈与反向归纳策略.pptVIP

下载本文档

5
0
约7.46千字
约 45页
2017-06-26 发布于湖北
举报
版权申诉

4.扩展式博弈与反向归纳策略.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

4.扩展式博弈与反向归纳策略

第四讲扩展式博弈第一节扩展式博弈的定义与形式一、定义扩展式博弈由下列要素构成： 1、决策点与决策分枝的结构，在初始决策点与最终结局点之间不存在任何闭环(closed loops) 2、清楚地指明什么决策点属于哪一个参与者。 3、在宇宙（自然）决策点上选择的概率。 4、参与者作决策时所依据的信息集；信息集把参与者在某一时刻的所有决策点分成若干类。 5、在博弈的终极点上每一个参与者的收益。例：房地产开发博弈需求大，开发者利润8千万，不开发者利润0。需求大，两者都开发利润各为4千万。需求小，开发者利润1千万，不开发者利润0。需求小，两者都开发利润各为-3千万两者都不开发利润各为0。博弈树：不允许的情形违反传递性和反对称性假设信息完全与不完全信息集是每个人进行决策的依据。如果某人在某决策时刻的信息集包含两个或以上的决策点，则博弈的信息就是不完全的。如果所有的信息集都只包含一个决策点，则称博弈就是信息完全的。扩展式博弈的形式不完全信息的情况扩展式博弈的规则每个决策点至少有一个箭头指向它（表示至少有一个参与者的行动会产生该结果），同时至多也只有一条箭头指向它。如果我们从某一点向初始点返回，我们就不可能再通过迂回的途径回到这点，我们只能按反向逐次返回原点。扩展式博弈一个人不可能在他不知道有哪些选择的情况下作出有意义的选择。为了保证局中人在博弈的任何节点总是知道他面临的选择，如果两个决策节属于同一局中人的同一个信息集，那么他们的行动分支就必须相同。动态博弈的基本特点策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合，构成一条路径得益对应每条路径，而不是对应每步选择、行为动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利，有“先行优势”。扩展式博弈完美回忆假设当某个局中人行动时，他记得在这之前他知道的所有的信息。扩展式博弈完美信息没有两个决策节属于同一个信息集。也就是说，当某一局中人开始行动时，他知道过去的一切。策略扩展式博弈的策略是一套为局中人的每一个可能信息状态决定行动的规则。数学上，策略是一个把信息状态映射到行动的函数。共同知识 1.参与人的知识阶次零阶知识：某一事实 “亮平生谨慎，不曾弄险” 一阶知识：参与人知道某一事实司马懿知道“亮平生谨慎，不曾弄险” 二阶知识：诸葛亮知道“司马懿知道‘亮平生谨慎，不曾弄险’”。 K阶知识: (参与人知道)k “某一事实” “计”高一筹 2、共同知识解释一：共同知识指“所有参与人知道，所有参与人知道所有参与人知道，所有参与人知道所有参与人知道所有参与人知道…”。解释二：如果每个参与人都知道某个事实，每个参与人都知道每个参与人都知道它，如此等等，从而形如“（每个参与人都知道)k (k次方)每个参与人都知道它”的语句对k=0，1，2，…都是正确的，那我们就称这个事实为参与人中间的共同知识。解释三：这是一个“由己及人，由人及己”的无限推理过程，是k→∞时的高阶知识((每个人)k-1) (k-1次方)。一件事一旦在某个群体中成为共同知识，则从任何一个个体出发，他对这件事的理解等等都已达到了完全的统一，不再有任何层面的不确定性（奥曼，1976）。某一事实成为所有参与人的K阶知识，且K趋向无穷大。在共同知识假设下，参与人博弈的各方没有智力高低之分。对于扩展式博弈，博弈树的结构是参与人的共同知识；对于策略式博弈，支付矩阵是参与人的共同知识。 “脏脸问题” 有三个人，他们的脸都是脏的，但是自己都不知道，他们各自只能看到其他人的脸是脏的还是干净的。这时如果让他们判断自己的脸是干净的还是脏的，显然3个人都说不出。这时，作为局外人的我告诉他们：“你们之中至少有一个脸是脏的！”，其实这明显是一句“废话”，因为每个人都可以看到其余两个人的脸都是脏的，但就因为这一句看似没用的话，游戏就可以进行下去了。这时我再问第一个人脸是脏的还是干净的，他还是答不出来，问第二个人，也答不出来，但是当我问第三个人的时候，如果他足够聪明的话，就应该肯定的回答，我的脸是脏的！推理过程也很简单，第一个人答不出来，说明二、三至少有一个脸是脏的（否则第一个人就知道自己脸是脏的了），第二个人当然知道第一个人的推理，如果这是他看到三的脸是干净的，就可以迅速判断自己的脸是脏的，第三个人看第二个人还说不出来，拿自己的脸肯定是脏的了。这个过程相信很多人都可以很容易理解。关键是为什么一句看似很没用的话就会让结果不同呢？换句话说，如果不说“你们之中至少有一个脸是脏的”这句话，每个人也知道这件事，而且每个人也知道其他人知道这件事。问题就在于，没有说这句话之前，每个人不知