博弈讲稿12.pptVIP

下载本文档

7
0
约5.17千字
约 27页
2016-12-13 发布于河南
举报
版权申诉

博弈讲稿12.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第一章??? 引论§1.1 长街上的超市 §1.2 共同投资问题 §1.3 什么是博弈论博弈论：就是关于包含相互依存情况中理性行为的研究。相互依存：通常是指博弈中的任何一个局中人受到其他局中人的行为的影响，反过来，他的行为也影响到其他局中人相互依存的另一个方面是局中人可以有某些共同的兴趣或利益所在。 “理性行为”的说明：博弈论中的所谓理性，一般不是指道德标准。由于局中人的相互依存性，博弈中一个理性的决策必定建立在预测其它局中人的反应之上。一个局中人将自己置身于其它局中人的位置并为他着想从而预测其它局中人将选择的行动，在这个基础上该局中人决定自己最理想的行动，这就是博弈论方法的本质与精髓。盈利函数(payoff function) 博弈的三个要素： 1．局中人以i=1，2，…，表示 2．每个局中人一般有若干个策略（strategies）可供选择，它们构成了该局中人的纯策略空间。局中人i的纯策略空间用Si 表示，倘若Si 由ki个纯策略构成，则有Si　=（si1，si2，…，si k）。纯策略空间有时也可以是连续的，比如在AB线段的海滩上摊位的选择就可认为几乎是连续的。 3．每个局中人的盈利函数。我们记局中人i的盈利函数为ui（s），其中s=(s1，… ,sy)，而sj表示局中人j所取策略，s表示r个局中人的策略向量。显然，盈利函数ui（s）与s有密切关系。它是每个局中人真正关心的东西。博弈的四种情况完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈第一部分完全信息静态博奕第二章策略型博奕与Nash均衡§2?1 两人零和博奕——猜谜定义2.1： n人博弈的正则型（或策略型）表示指定了n 个局中人以及他们各自的纯策略空间S1，S2，…，Sn和这些局中人各自得到盈利函数u1，u2，…，un。我们将该博弈表示为： G={S1, S2, …, Sn; u1, u2, …, un } §2. 2 混合策略局中人2若出示1，期望盈利为 – p – (1 – p) = 1 – 2p ?0 局中人2若出示2，期望盈利为 p – (1 – p) = 2p – 1?0 局中人i（i = 1，2，…,I）的一个混合策略是该局中人的纯策略空间Si＝ (Si1，Si2, …，Si ki）(Si共有ki个纯策略)上的概率分布, 以数学符号σi来表示。所有I个局中人各自采取的混合策略σ1，σ2，…,σI是统计独立的。例2.1 二人博弈的盈利矩阵如下： §2. 3 累次严优(iterated strict dominance) 每一个局中人舍弃自己的劣策略或条件劣策略的做法从逻辑上说是令人信服的。从某一个局中人的角度出发排除该局中人的劣策略，然后在“缩小了的”“条件”博弈中，从另一个局中人角度出发，剔除此人的劣策略，这样一步一步地进行下去，除非到某一步不存在所谓的劣策略，否则可以一直剔除下去，最后幸存下来的结局合乎逻辑地成为博弈的预测结局。我们称这个过程为累次取优（iterated dominance），更精确地，应称为累次严优（iterated strict dominance）。累次严优法对于预测博弈的合理结局是有局限性的。累次剔除劣策略过程先从局中人1 开始与先从局中人2 的角度出发其最后结果是否一样？面临的问题是在纯策略之间无优劣之分时，是否可以考虑混合策略的优劣，或者问混合策略是否有严劣策略之说，累次严优解的范围窄小常常使得它成为博弈问题的“理想”预测，但是在这里，我们想指出有时候理想的事情未必在实际生活中行得通。尤其是在盈利函数取极端值时会出现“反常”现象。定义2.2：定义2.2 对于局中人i的(混合)策略空间∑i中的某个纯策略si，如果存在混合策略σi*∈∑i使得 Ui(σi*, s-i)≥Ui(si ,s-i) 对任意s-i∈S-i成立，且在S-i中至少存在一个纯策略组合s-i*∈S-i，使（2.9）式中的不等号严格成立 Ui(σi*, s-i*) Ui(si ,s-i*) 则称纯策略si为局中人i的弱劣纯策略；倘若对一切s-i∈S-i，（2.9）中的不等式都严格地成立： Ui(σi*, s-i) Ui(si ,s-i)s-i∈S-i 则称si为局中人i的严劣纯策略。纯策略劣于混合策略的现象囚徒窘境(Prisoner’s Dilemma) 智猪博弈 Nash均衡 Nash均衡因数学家Nash而命名，Nash均衡策略是指这样的策略组合（或剖面），为了极大化自己的盈利（或效用），每一个局中人所采取的策略一定应该是关于其它局中人所取策略的最佳反应。因此没有一个局中人会轻率地偏离这个策