- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论与公共政策
北大精品课件
完全信息静态博弈
主要内容
一、博弈的标准式表述
二、占优策略均衡
三、重复剔除的占优均衡
四、纳什均衡
五、多重纳什均衡的比较
六、混合策略
七、应用举例
何谓静态博弈?
开始时由参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果。
何谓完全信息静态博弈?
每一参与者的收益函数在所有参与者之间是共同知识。
一、博弈的标准式表述
博弈的标准式表述包括三个方面的内容:
(1)博弈的参与者
(2)每个参与者可供选择的策略集
(3)针对所有参与者可能选择的策略组合,每个参与者获得的收益
对于一个 n 人博弈,设各参与者的策略空间依次为 S1,S2, …,Sn ,收益函数分别为u1,u2, …,un ,其中 ui (s1,s2, …,sn) 为参与者选择策略组合 (s1,s2, …,sn) 时参与者 i 的收益,则可用标准式将该博弈表示如下:
G = {S1,S2, …,Sn ; u1,u2, …,un }
在双人有限策略的情况下,可以用双变量矩阵更直观地表述博弈。
例1:囚徒困境
但是,如果参与者超过2人,则用双变量矩阵形式来表示博弈就不那么方便了,甚至根本无法采用这种形式。
例2:三人有限策略博弈
二、占优策略均衡
1、占优策略
在博弈中,如果不管其他参与者选择什么策略,某个参与者的特定策略都优于或至少不劣于其他所有策略,那么,我们就说这个特定策略是该参与者的占优策略。
在前面的囚徒困境博弈中,“招认”就是每个囚徒的占优策略。
2、占优策略均衡
如果每个参与者都存在占优策略,那么由这些占优策略构成的组合就称为占优策略均衡。
在前面的囚徒困境中,(招认,招认)就构成一个占优策略均衡。
注意:
占优策略均衡只要求每个参与者是理性的,而并不要求每个参与者知道其他参与者是理性的,也就是说,不要求“理性”是共同知识。
例3:公共产品的供应问题
A、B两人同住一室,现在,他们考虑是否购买一台电视机。电视机的价格为4000元,每个人从看电视中获得的效用各为3000元。
假定他们根据下列程序决定是否购买电视机:
每人把是否购买电视机的想法写在一张纸条上,如果两人都认为应该购买,则平均分担购买电视机的费用。如果两人都认为不应该购买,则不购买电视机。如果只有一人提出购买而另一人不想购买,则由提出购买的人独自购买电视机。
每个人会如何决策?
三、重复剔除的占优均衡
1、重复剔除的占优均衡
首先从某一参与者的策略集里剔除掉一个劣策略,再重新考察各个参与者剩下的策略中哪些是劣策略并剔除其中之一,不断继续这一过程直到每个参与者都仅剩一个策略为止,最后得到的策略组合就称为重复剔除的占优均衡。
例4:俾斯麦海之战
在单人决策中,当所有情况下的收益都增加(至少不减少)时,当事者的境况不会变得更坏,但在博弈中则未必。比较下面的两个博弈:
例 5
2、理性共识
重复剔除的占优均衡不仅要求每个参与者是理性的,而且要求“理性”是参与者的共同知识,即参与者具有“理性共识”(Common Knowledge of Rationality,简记为CKR)。
理性共识可划分为不同的层次:
零阶理性共识:每个人都是理性的,但不知道其他人是否理性。
一阶理性共识:每个人是理性的,并且知道其他人也都是理性的,但并不知道其他人是否知道自己是理性的。
二阶理性共识:每个人是理性的,也知道其他人都是理性的,而且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道他们知道自己是理性的。
依此类推。
例 6
选择越多(行动空间越大),对理性共识的要求越高。
请看下例:
例 7
四、纳什均衡
许多博弈既不存在占优策略均衡,也不存在重复剔除的占优均衡。
例 8
1、纳什均衡的定义
如果存在这样一个策略组合――给定该策略组合中其他参与者的选择,没有人有积极性改变自己的选择,我们就说该策略组合是一个纳什均衡。
交通规则问题就是一个很好的例子:
例9:交通规则问题
纳什均衡是一种一致预期:基于信念的选择是合理的;支持选择的信念是正确的。
这种一致预期能够自我实现,不会出错:如何所有人认为这个结果会出现,这个结果就会出现。
以交通规则问题为例,如果甲认为乙预期甲将靠右走,甲就确实会选择靠右走。
2、纳什均衡的意义
如果某个策略组合为纳什均衡,那么任何一个参与者都没有激励独自背离他所选定的策略。这就是说,该策略组合是“策略稳定”或“自动实施”的。
换一种说法,如果参与者事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。
3、严格纳什均衡与弱纳什均衡
4、用划线法求纳什均衡
例 10
5、纳什均衡与重复剔除的占优均衡之间的关系
命题一:
纳什均衡不会被重复剔除严格劣策略过程所剔除。
您可能关注的文档
- 2013年高考物理二轮复习专题讲义: 物态变化与气体定律.doc
- ★高考二轮复习专题三机械振动与机械波-高三年级高考第二轮总复习物理专题研究.doc
- 2011年中考历史专题复习要点新.doc
- 2014-2015学年九年级第一学期物理10月阶段检测试卷【江苏省镇江市新区】.doc
- 01北京市西城区2012年中考二模YDA.doc
- 2012—2013学年度下学期第一次段考高二级语文试题.doc
- 2012高考英语高频词汇单选专练3.doc
- 4.5年级阅读1.doc
- 2014届高考物理一轮复习 第13章 第2单元《光的干涉、衍射与偏振现象》定时跟踪检测 新人教版 Word版含解析.doc
- 2014年 成人学位英语冲刺试题和答案十一.doc
- 华兴资本2025年产业AI应用热力报告21页.pdf
- HEADLINER-释放信任人工智能安全的蓝图.pdf
- 观察家研究基金会ORF2025全球人工智能AI的未来研究报告英文版23页.pdf
- 开放式创新SSbD和DPPs数字化以及对创新资产的有效和公平的共同创造和共享的追求PeterKlein博士.pdf
- 先进材料研发的挑战GerdLoehden.pdf
- 基于对生物降解性和数字工具的基本理解的可生物降解材料设计AndreasKuenkel.pdf
- 欧盟的循环性重点关注钢铁行业JurgenTiedje.pdf
- 研报食品饮料行业啤酒旺季来临关注东鹏饮料上市-21051616页.pdf
- 促进欧盟与日本合作开发建筑先进材料TakafumiNoguchi.pdf
- 利用人工智能进行多模态数据分析健康科学和研究中的实际应用.pdf
文档评论(0)