两阶段博弈.ppt

下载文档

56
0
约4.6千字
约 19页
2016-09-04 发布于天津
举报
版权申诉
保障服务

两阶段博弈.ppt

1、本文档共19页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

两阶段博弈.ppt

* * * * * * * * 张醒洲，大连张醒洲，大连完全非完美信息两阶段博弈第3章和第4章要点博弈类型举例解的概念简单的完全且完美信息动态博弈 Stackelberg (1934) 双寡头垄断模型鲁宾斯坦 (1982) 讨价还价模型 Backwards Induction Outcome (BIO) 后向归纳结果 2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”) LazearRosen Tournaments (1981 ) 工作竞赛模型 Subgame Perfect Outcome (SPO) 子博弈完美结果动态博弈中心问题: 可信威胁与承诺会影响现在的行为下一次博弈开始前的所有博弈结果都能被观察到的重复博弈 Subgame-perfect Nash equilibrium 子博弈完美NE Outline of Unit 3 and 4 完全信息动态博弈表述 Normal-form / Strategic-form 标准式/策略式 Extensive-form 扩展式解的概念 Nash Equilibrium (NE) Nash均衡 Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡 Central Issue 中心问题 credibility threats or promise (self-enforcement) 可信性威胁或承诺 Theme 主题思想一个完全信息动态博弈可能会有很多个纳什均衡，但是有些均衡包含了不可置信的威胁和承诺。子博弈完美纳什均衡就是通过了可信任检测的均衡。完全非完美信息两阶段博弈：时间顺序博弈的过程按一系列的阶段进行，下一阶段开始前参与人可观察到前面所有阶段的行动。本节我们允许每一阶段中存在着同时行动，这就包含了非完美信息。 1. 参与人1和2同时从各自的可行集 A1和 A2 中选择行动a1和a2； 2. 参与人3和4观察到第一阶段的结果(a1, a2)，然后同时从各自的可行集 A3和 A4中选择行动a3和a4； 3. 收益为ui(a1, a2, a3, a4) ， i = 1,2,3,4。完全非完美信息两阶段博弈: 后向归纳法我们仍然沿用后向归纳的思路解决此类博弈问题。但这里从博弈的最后阶段后向推导的第一步就包含了求解一个真正的博弈（给定第一阶段结果时，参与人3和4在第二阶段同时行动的博弈），而不再是前一节求解单人最优化的决策问题。为了简化问题，本节中我们假设对第一阶段博弈每一个可能结果（a1, a2)，第二阶段博弈（参与人3和4之间的博弈）有唯一的纳什均衡，表示为如果参与人1和2预测到参与人3和4在第二阶段的行动为对第一阶段行动的最优反应，则参与人1和2在第一阶段的问题就可用以下的同时行动博弈表示： 1. 参与人1和2同时从各自的可行集 A1和 A2 中选择行动a1和 a2； 2. 收益情况为ui(a1, a2, a3*(a1,a2), a4 *(a1,a2)) , i =1,2；假定(a1*,a2*)为以上同时行动博弈唯一的纳什均衡，我们称 (a1*, a2*, a3*(a1*,a2*), a4 *(a1*,a2*)) 为这一两阶段博弈的子博弈完美解。此解与完全且完美博弈中的后向归纳解在性质上是一致的，并且与后者有着类似的优点和不足。完全非完美信息两阶段博弈:子博弈完美结果完全非完美信息两阶段博弈:不可置信的威胁如果参与人3和4威胁在后面的第二阶段博弈中，他们将不选择纳什均衡下的行动，参与人1和2是不会相信的，因为当博弈真的进行到第二阶段时，参与人3和4至少有一个人不愿把威胁变为现实（这是因为它不是第二阶段博弈的纳什均衡）。另一方面，假设参与人1与参与人3是同一个人，并且参与人1在第一阶段并不选择a1*，参与人4就会重新考虑参与人3（即参与人1）在第二阶段将会选择a3*(a1,a2)的选择。工作竞赛: 描述考虑为同一老板工作的两个工人，工人（其中等于1或2）生产的产出，其中是努力程度，是随机扰动项。生产的程序如下：第一，两个工人同时选择非负的努力水平；第二，随机扰动项和相互独立，并服从期望值为0、密度函数为的概率分布；第三，工人的产出可以观察，但各自选择的努力水平无法观测，从而工人的工资可