- 565
- 0
- 约小于1千字
- 约 14页
- 2018-03-26 发布于河南
- 举报
序贯均衡
序贯均衡 讲义逻辑 举例 序贯博弈 序贯博弈是指参与者选择策略有时间先后的博弈形式。 序贯均衡 序贯均衡 对于一个有限 扩展式博弈,如果一个判断是一致的且序贯理性的,那么,它便是一个序贯均衡。 1、合理的形成一个一致性的判断;2、该判断上的策略使支付最大。 序贯均衡 有限扩展式博弈 一个判断是一致 序贯理性 一致性判断 1、贝叶斯法则:在一个合理的状态中,信念体系p应当是应用贝叶斯法则从既定的行为策略b中推导出来的——当这样做是可行的,也就是在信息集在均衡路径上。 信念体系 信念体系p(x)是指在在信息集I(x)上的一个概率分布,该概率分布描述了该信息集上的参与人 关于博弈进入该信息集上每一个决策结的的概率(后验概率)。显然,这些概率和=1。 判断/状态(p,b)是一对信念体系/行为策略有序组合,给定状态(p,b),信念p可解释为给定行为策略b已被采取时,参与人所持有的信念。 一致性判断 2、独立性:信念必定反映出参与人独立的选择他们的策略。 3、共同信念:具有相同信息的参与人具有相同的信念。 序贯理性 子博弈完美均衡要求在博弈的每一个子博弈上的选择都是最优的。这里,我们将其扩展,即要求每个参与人在其每一个信息集上做出的选择都是最优的。 怎样计算某个信息集上的支付? 设ui(b/x)是信息集I中的决策结x被博弈经过时给参与人带来的支付,给定信息体系(p,b),它给信息集上的每一个决策结分派了概率,那么,该信息集I上的期望支付是: 序贯理性 如果对于每一个参与人i,每一个属于参与人i的信息集I及其每一个行为策略bi,存在如下的关系式: 那么对于一个有限扩展式博弈,判断(p,b)是序贯理性的即: 序贯理性 如果对于一些信念体系P,判断(p,b)如上面一样是序贯理性的,那么,我们也称行为策略组合b是序贯理性策略。 也就是说,在博弈的任意决策结上(包括未被经过的),没有参与人有改变其策略的动机,那么该判断是序贯理性的。 序贯均衡的存在性 每一个具有完美记忆的有限扩展式博弈至少存在一个序贯均衡。此外,如果一个判断(p,b)是序贯均衡,那么行为策略b是一个子博弈完美均衡。 例子 例子
您可能关注的文档
最近下载
- 第10课《学会表达》教案-2025-2026学年第二学期三年级道德与法治统编版下册.docx
- 2026年湖南环境生物职业技术学院单招职业倾向性考试模拟测试卷附答案.docx VIP
- 2025年AWS认证AmazonRDS只读副本的只读副本用于数据仓库ETL专题试卷及解析.docx VIP
- (5)--《食品添加剂》课程教案.doc VIP
- (3)XH-BJDW-72(GY.24)型LED信号机故障报警仪说明书V1.0.pdf VIP
- 2026年广东教师招聘考试(教育教学通用能力测试)历年参考题库含答案详解.docx VIP
- 机械制造技术基础贾振元课后答案.pdf VIP
- ISO 22163:2023标准培训讲义.pptx
- 分析绿色建筑材料与传统建筑材料在性能和成本方面的优劣对比.pptx VIP
- 外研版五年级下册英语全册教案(三起).pdf VIP
原创力文档

文档评论(0)