博弈论概要1-3完全版I.docxVIP

下载本文档

0
0
约2.07千字
约 3页
2023-07-28 发布于四川
举报
版权申诉

博弈论概要1-3完全版I.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

交通大学博弈论课程概要（I）周林二零零四年十二月主要教材：博弈论（Fudenberg Tirole）引言：博弈论与决策论的差别.例子：田忌赛马，换钱. 第一部分：完全信息策略式博弈一静态博弈 .策略式博弈的基本三要素：博弈者，策略空间，收益函数（FT 1.1） .策略式博弈的基本三解法： a,占优策略.例子：囚徒困境，二价拍卖（Ebay,易趣网）（FT1.1） b.重复剔除劣策略.例子：双寡头Coumot竞争（线性需求）（FT 1.1, FT2.1） c. Nash均衡（最重要的概念）（FT 1.2）三种解法的合理性依次减低，而三种解法的适用范围（存在性）依次增加. Nash均衡存在性定理：如果策略空间是凸紧集，收益函数连续和自拟凹，至少存在一个Nash均衡.（FT 1.3）证明基本思路：最佳反应映射是从策略空间到策略空间的（上半）连续映射（Berge定理）,最佳反应映射的不动点就是Nash均衡. 利用（Kakutani不动点定Jf） Brouwer不动点定理找出不动点.（注意：这里的最佳反应映射不是一个压缩映射，因此不能用迭代法逼近不动点.）推论：任何有限策略博弈至少有一个混合策略Nash均衡. Nash均衡一般非唯一，非Pareto最优.可以通过外在信号机制改善收益. 相关均衡：公共信号仅将不同的Nash均衡混合，私人信号更为有效. （FT 2.2）作业：1.1, 1.2, 1.5, 1.7, 1.10, 1.12, 2.2 （FT）.以及下面的题目: A.证明任何一个满足Nash均衡存在性定理的对称博弈（首先给出一个合理的定义）一定存在一个对称的Nash均衡. B.画出下列博弈中所有的相关均衡生成的收益向量：博弈者2 博弈者1 -1, -1 2. 1 1,2 5/3, 5/3 第二部分：完全信息扩展式博弈一动态博弈 .例子：斯塔克伯格模型(FT 3.1) .多阶段可观察行为博弈(FT 3.3.2) 0 阶段:每一个博弈者可以独立选择一个行动ao g A,. 1阶段:在本阶段前的历史例=。。=(…M。)涣定十本阶段每一个博弈者可以选择的行动的范围人］(小).每一个博弈者再独立选择一个行动Qi e A (hi). 上阶段:在本阶段前的历史加= 3。,。,…,GT)决定了本阶段每一个博弈者可以选择的行动的范围A (小).每一个博弈者再独立选择一 i 个行动征e A (hk). 博弈在K阶段后中止.(我们允许K为无穷，此时博弈可能进行无限阶段.)每一个博弈者获得的收益取决于博弈的全部历史 hK+l =(Q0,Q1,???,QK)： U= 4 (Z/K+l). (不一定每一个博弈者在在何二个阶段攵和历史小?时都要做选择.此时我们只要让\a(4)|=1即可.) .多阶段可观察行为博弈的策略式博弈表示(FT 3.3.2) 策略空间：每一个博弈者的策略是一个完整的计划，包括了在所有的阶段人和所有可能发生的历史小时会采取怎样的相应行动(想象一本理想化的棋谱). 收益函数:对于任何一个所有博弈者的策略的组合，我们可以逐阶段的找出相应博弈者行动的历史，从而决定每一个博弈者获得的收益. .多阶段可观察行为博弈的求解(FT 3.5) 对任何一个多阶段可观察行为博弈，我们首先可以找出它的策略式博弈的Nash均衡.但是其中可能含有不合理的解，我们需要对Nash均衡进行挑选(精炼). 逆向归纳法:仅适用于具有完美信息的有限阶段的博弈. 子博弈完美:可以用于所有的多阶段可观察行为博弈. 一个多阶段可观察行为博弈G在任何一个历史力出后的延续本身也是一个博弈.我们称其为原博弈G的一个子博弈，记为G(/m). 如果G的一个Nash均衡在它所有的子博弈上的限制也是子博弈的一个Nash均衡，我们称之为一个子博弈完美的Nash均衡. .子博弈完美Nash均衡的判断条件：单阶段偏离原则* (FT 332) .子博弈完美Nash均衡的应用：囚徒困境的重复博弈，有限和无限情况 (FT 4.3) .子博弈完美Nash均衡的应用：Rubinstein议价模型(FT 4.4) 作业：3.3, 3.5,3?7,3?8,4.5(a)(b),4.8 .以及下面的题目: 证明：在囚徒困境的有限重复博弈中，任何一个Nash均衡(不管是否子博弈完美)的途径一定是每阶段(不合作,不合作). G是一个静态双人策略式博弈.每个博弈者有潭个选择变量：、用弈者一选择％和y ,博弈者二选择x和y.假设(*, y*), (%*, y*)券G的 TOC \o 1-5 \h \z 11 2 2 11 2 2 Nash均衡. ? 现在我们将G变化为一个双人两阶段博弈G.在阶段0时人博弈者一选择元，博弈者二选择x .在阶段1时: 当双方都观测到x和x之