- 139
- 0
- 约2.9千字
- 约 16页
- 2019-05-08 发布于浙江
- 举报
讲座12
重复博弈I
14.12 博弈理论
穆罕默德·伊尔蒂兹
路线图
1、小测验
2 、有限重复博弈
1)进入遏阻博弈/连锁店悖论
2 )重复囚徒困境
3 )一个普遍性结论
4 )存在多个均衡
3、行为公开条件下的无限重复博弈
1)贴现/现值
2 )单偏差原理
3 )实例
进入遏阻博弈
(进入) (容纳)
(反击)
重复二次的进入遏阻博弈
如果有N个进入者将会怎样?
Goliath软件(GS)与新来者
新来者
如果有N个新来者将会怎样?
二次、多次重复的囚徒困境
• 日期T={0,1};
• 每个日期进行囚徒困境博弈:
• 在日期1初期所有参与者可观察到日期0
的策略。总收益为各阶段收益之和。
重复二次的囚徒困境博弈
如果T={0,1,2,…,n},情况又会怎样?
一个普遍性结论
• G=“ 阶段博弈”=有限博弈
• T={0,1,…,n}
• 在T 中每一日期t ,进行G博弈,所有参与者知
道t之前采取的所有行动
• 总收益=阶段博弈收益之和
• 该博弈称为GT
定理:如果G拥有唯一的完美子博弈均衡s*,则
GT有唯一的完美子博弈均衡,其中参与者每个
阶段都选择s* 。
存在多个均衡
s*=
• 当t=0,选择(B,M)
• 当t=1,如果t=0 时是(B,M),
则选择(C,R);否则,选择
(A,L)
你知道完美子博弈均衡路径上
的策略?
• (B,M) (B,M) 不
• (B,M) (A,L) 不
• (B,L) (C,R) 是
• (C,L) (C,R) 不
• 令T={0,1,2}
• (C,L) (B,M) (C,R) 是
行为公开条件下的
无限重复博弈
• T={0,1,2,…,t,…}
• G=“阶段博弈”=有限博弈
• 在T 中每个日期t ,进行G博弈,所有参与
者知道t之前采取的所有行动;
• 总收益=阶段收益之贴现和。
• 此博弈称为G(T) 。
定义
一给定收益流π= 的现值是
一给定收益流π的均值是
一给定收益流π在日期t 的现值是
博弈历史就是一系列过去观察到的策略选择。如:
单偏差原理
• 是一完美子博弈均衡。
• 它可通过以下检验
• 对每一历史和每一个参与者i,假设
—所有人从明天开始将遵循s,
—今天除i之外
原创力文档

文档评论(0)