贝叶斯均衡最新.pptVIP

  • 38
  • 0
  • 约4.7千字
  • 约 40页
  • 2017-06-18 发布于湖北
  • 举报
信息不完全条件下的囚徒困境问题 信息完全静态条件下的囚徒困境博弈的唯一纳什均衡是双方都不合作(坦白)的策略,这不是帕累托最优的。对有限次囚徒困境博弈情况并未改进,只有无限次博弈下去,每阶段局中人都采取合作的策略有可能成为子博弈精炼纳什均衡,但大量的经验数据表明即使在有限次重复的囚徒困境中,局中人双方采取合作的策略也是经常发生的。 有限次囚徒困境中,假设囚徒1有两种类型:理性和非理性,这是囚徒1的私人类型。两种类型的概率分布为两人的共同知识。 P(理性)=1-p,P(非理性)=p 囚徒2是理性的,理性的囚徒可以选择任何策略,而非理性的囚徒仅选择“针锋相对”策略,即第一阶段选合作,而在t1阶段选择与对手在t-1阶段想同的行动。 支付矩阵为(设贴现因子 ) X=D,囚徒2的期望支付为p(1+a)+(1-p)b X=C,囚徒2的期望支付为pa 所以,囚徒2第一阶段选择D的充要条件是 p(1+a)+(1-p)bpa t=1 t=2 非理性囚徒1 D X 理性囚徒1 C C 囚徒2 X C 理性的囚徒1和非理性的囚徒1都没有动机背叛上表中的策略 囚徒2的期望支付为1+p+(1-p)b+pa 当1+p+(1-p)b+paa 且1+p+(1-p)b+paa+b+pa时囚徒2没有动机背叛,上表为均衡路径。 t=1 t=2 t=3 非理性囚徒1 D D D 理性囚徒1 D C C 囚徒2 D D C t=1 t=2 t=3 非理性囚徒1 D C C 理性囚徒1 D C C 囚徒2 C C C t=1 t=2 t=3 非理性囚徒1 D C D 理性囚徒1 D C C 囚徒2 C D C 结论:对于T期重复的囚徒困境博弈,如果阶段博弈支付矩阵中元素a,b及非理性的囚徒1的概率p满足 p(1+a)+(1-p)bpa, 1+p+(1-p)b+paa, 1+p+(1-p)b+paa+b+pa, 则对所有T3,都存在下述合作均衡,并在T-1和T期选择如下表。(证明略) t=T-1 t=T 非理性囚徒1 D X 理性囚徒1 C C 囚徒2 X C 谢谢! 人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。 * 贝叶斯均衡及其应用 预备知识(共同知识) 静态博弈中的贝叶斯均衡 不完全信息下的古诺模型 用贝叶斯均衡解释混合策略均衡 显示原理 动态博弈中的贝叶斯均衡 信号传递博弈的精炼贝叶斯均衡 单一价格二手车模型 就业市场信号博弈 信息不完全条件下的囚徒困境问题 不完全信息博弈: 不完全信息意味着至少有一个参与人有多个类型。不完全信息博弈是指、至少有一参与人不知道其他参与人的支付函数。比如说, 你想去买件衣服时, 你并不清楚衣服的最低价, 你和某人谈恋爱, 但在结婚前, 双方都是展现最好的一面, 双方都不是很了解对方的很多品质, 等等, 这样的例子举不胜举。在古代, 人们已经开始用到不完全信息博弈了。比如在《三国演义》中, 周瑜伪造假降书, 诱骗曹操杀了蔡摺、张允二将。曹操遂派蔡中、蔡和两兄弟假装降周瑜, 企图夺取东吴情报。周瑜识破曹操的诡计, 将计就计, 对黄盖施以苦肉计。这一博弈中, 曹操只知道自己的部下蔡中、蔡和是假降, 但不知道周瑜的情报周瑜知道蔡中、蔡和是假降, 但曹操不知道周瑜知道自己是假降, 曹操不知道周瑜已经识别了自己的计划。也就是说曹操的信息对周瑜的信息是不完全的, 但周瑜很清楚曹操计谋, 于是周瑜就将计就计。这一博弈属于不完全信息博弈。 私人信息和共同信息的区别: 1、私人信息 2、共同信息 共同知识 共同知识:并非是每个人都知道的知识 两个例子:脏脸问题 信封之谜 脏脸问题: 甲、乙、丙三人都戴红帽子,他们可以看到对方的帽子颜色,但看不到自己帽子的颜色,问甲自己戴什么颜色的帽子?问乙自己戴什么颜色的帽子?问丙自己戴什么颜色的帽子?都回答不出。但一个旁观者告诉他们“他们至少有一人戴红帽子”,问甲自己戴什么颜色的帽子?问乙自己戴什么颜色的帽子?最后问丙自己戴什么颜色的帽子?甲、乙不知,丙却知道自己的是红帽子。 他们没人都知道他们至少有一人戴红帽子,也知道对方也知道他们至少有一人戴红帽子,但是对甲而言,他不知道乙知道丙知道他们至少有一人戴红帽子,所以该信息虽然每人都知道,但不属于共

文档评论(0)

1亿VIP精品文档

相关文档