- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
启 示 该类博弈与求同存异有相似之处,双方有共同的利益,差异在于求同的两种结果中,一种是风险占优的,一种是帕累托占优的。 考试作弊问题 (四)公共产品博弈模型-公共地悲剧 公共地悲剧:过度使用 n个农民决定自己放牧的数量,用gi∈[0, ∞]表示农户i的放牧量,G= ∑g i代表放牧的总量,υ(G)代表每只羊的平均价值,当G<GMAX时,υ(G)>0,当G≥GMAX时,υ(G)=0,并且有,?υ/?G <0,?2υ/?G2 <0。 设购买羊羔的成本为c,则利润函数为: ?i(g1,…,gi,…,gn)=giυ(G)-gic i=1, 2, …, n 最优化的一阶条件是: ??i/?gi=υ(G)+giυ?(G)-c=0,i=1, 2, …, n 上述n个反应函数的交点就是纳什均衡:g*=(g1*, g2*, …, gn*),纳什均衡时的总饲养量为G*,满足: υ(G*)+G*υ?(G*)/n-c=0 而对社会来说,最优的饲养量是使得 Gυ(G)-cG 最大化,即G**满足: υ(G**)+G**υ?(G**)-c=0 由于G*>G**,公有草地被过度使用。 思考 公共地悲剧的现实中有哪些情形?有何启示? (4)防联盟均衡 联盟,在最大化联盟成员的利益时损害了其他局中人的利益。 在多人博弈时,为了防止部分人结成联盟,其他人会采用防联盟均衡。 防联盟例子 (U,L,A)帕累托优于(D,R,B),然而,丙为了防止甲、乙组成联盟来欺诈丙,丙将采用防联盟策略B,因而(D,R,B)是一个防联盟均衡。 在n人博弈中,任何k(1?k?n-1)人联盟都不会发生背离现象的纳什均衡是一个合理预测,即防联盟均衡。 (5)颤抖手均衡 颤抖手均衡的基本思想是,一个策略组合只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优策略组合时,才是一个均衡。 称纳什均衡?是一个颤抖手均衡,若存在严格混合策略序列?m ??(m??),且对所有的i和m,?i是对策略组合?-im的最优反应,即对任何可选择的混合策略?i?,有: 颤抖手均衡应用 博弈与对抗性 在零和博弈中,对抗性最强,属于“你死我活型”博弈。 囚徒困境博弈中存在双赢的可能。 求同存异(情侣博弈)中,博弈双方大局利益一致。 胆小鬼博弈(斗鸡博弈) 共同打猎博弈 交通规则博弈:都靠左,或者都靠右 问题: 如何实现帕累托最优均衡? 预先交流会增加实现帕累托最优均衡的可能性。 帕累托最优状态未必是纳什均衡(如囚徒困境博弈)。 丙 B A -1,-1,5 -5,-5,0 D 1,1,-5 -5,-5,0 D -5,-5,0 -2,-2,0 U 甲 -5,-5,0 0,0,10 U 甲 R L R L 乙 乙 该博弈有两个纯策略纳什均衡(U,L,A)和(D,R,B),及一个混合策略纳什均衡((0.5,0.5),(0.5,0.5),(0.5,0.5)) 参与人1 参与人2 0,0 -3,0 D 0,-3 1,1 U R L (U,L)和(D,R)都是博弈的纳什均衡; (U,L)是一个颤抖手均衡。 参与人1 参与人2 2,0 10,1 D 5,2 10,0 U R L (D,L)是一个纳什均衡(D是参与人1的弱劣策略); (U,R)是一个颤抖手均衡。 六、双人零和博弈 双人零和博弈:博弈只有两个人参与,且支付之和总是0,即两个局中人的利益完全对立。 对双人零和博弈而言,只需知道一个人的支付矩阵就确定了整个博弈,因而也称为矩阵博弈。 例:二人零和博弈 矩阵A=(aij)中元素aij表示参与人1 (行局中人)选择策略i,参与人2(列局中人)选择策略j时参与人1的支付(此时,参与人2的支付为- aij )。 1 0 1 -2 A= 2 1 1 -1 1 3 2 1 极小极大原理与纳什均衡 1 0 1 -2 -2 A= 2 1 1 -1 -1 1 3 2 1 1 max min 1 0 1 -2 A= 2 1 1 -1 1 3 2 1 这就是说,行参与人将选择 作为自己的合理支付。 这就是说,行参与人将选择 作为自己的合理支付,列参与人将选择 作为自己的合理支付。 1 0 1 -2 -2 A= 2 1 1 -1 -1 1 3 2 1 1 max min Max 2 3 2 1 Min 纯策略纳什均衡 定理1:对任意有限矩阵 ,有: 定义:如果对于某个 和 ,使得 则称 行和 列的那一点为矩阵的鞍点。 鞍点意味着同时满足行中最小和列中最大。 定理2:如果矩阵博弈存在
文档评论(0)