博弈论讲义入门.pdfVIP

  • 139
  • 0
  • 约2.9千字
  • 约 16页
  • 2019-05-08 发布于浙江
  • 举报
讲座12 重复博弈I 14.12 博弈理论 穆罕默德·伊尔蒂兹 路线图 1、小测验 2 、有限重复博弈 1)进入遏阻博弈/连锁店悖论 2 )重复囚徒困境 3 )一个普遍性结论 4 )存在多个均衡 3、行为公开条件下的无限重复博弈 1)贴现/现值 2 )单偏差原理 3 )实例 进入遏阻博弈 (进入) (容纳) (反击) 重复二次的进入遏阻博弈 如果有N个进入者将会怎样? Goliath软件(GS)与新来者 新来者 如果有N个新来者将会怎样? 二次、多次重复的囚徒困境 • 日期T={0,1}; • 每个日期进行囚徒困境博弈: • 在日期1初期所有参与者可观察到日期0 的策略。总收益为各阶段收益之和。 重复二次的囚徒困境博弈 如果T={0,1,2,…,n},情况又会怎样? 一个普遍性结论 • G=“ 阶段博弈”=有限博弈 • T={0,1,…,n} • 在T 中每一日期t ,进行G博弈,所有参与者知 道t之前采取的所有行动 • 总收益=阶段博弈收益之和 • 该博弈称为GT 定理:如果G拥有唯一的完美子博弈均衡s*,则 GT有唯一的完美子博弈均衡,其中参与者每个 阶段都选择s* 。 存在多个均衡 s*= • 当t=0,选择(B,M) • 当t=1,如果t=0 时是(B,M), 则选择(C,R);否则,选择 (A,L) 你知道完美子博弈均衡路径上 的策略? • (B,M) (B,M) 不 • (B,M) (A,L) 不 • (B,L) (C,R) 是 • (C,L) (C,R) 不 • 令T={0,1,2} • (C,L) (B,M) (C,R) 是 行为公开条件下的 无限重复博弈 • T={0,1,2,…,t,…} • G=“阶段博弈”=有限博弈 • 在T 中每个日期t ,进行G博弈,所有参与 者知道t之前采取的所有行动; • 总收益=阶段收益之贴现和。 • 此博弈称为G(T) 。 定义 一给定收益流π= 的现值是 一给定收益流π的均值是 一给定收益流π在日期t 的现值是 博弈历史就是一系列过去观察到的策略选择。如: 单偏差原理 • 是一完美子博弈均衡。 • 它可通过以下检验 • 对每一历史和每一个参与者i,假设 —所有人从明天开始将遵循s, —今天除i之外

文档评论(0)

1亿VIP精品文档

相关文档