均衡演进与占座行为的博弈分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
均衡演进与占座行为的博弈分析 在缺乏资源的现实中,使用座位和类似座位的现象很普遍,人们的认可也是不可否认的事实。如国家对专利知识产权的保护,美苏两国冷战时期在世界范围内的地盘争夺战等,都蕴含着相似的特征。经济学家研究制度产生并不断演进的过程,目的即在于剖析其引导和规范人们行为的机理,从而设计出更为完善的机制。本文从微观和演化的角度,通过建立占座行为的博弈模型,阐明了占座行为获得人们的普遍承认有其一定的必然性,这种制度安排在特定条件下是演化稳定的纳什均衡。 1 占座者的博弈建模 占座现象在高校的自习教室中非常普遍,不外乎包括以下两个过程: 先到者找到空位,要么坐下来学习,要么在座位上放上物品表示已被占用,然后去处理别的事情。后达者找不到空座位,面对已有物品占据的地方,可以选择离开,也可以把别人的东西往边上挪一挪,等占座者回来后再作道理。当占座者返回时,双方将同时面临要么据理力争,要么放弃座位的选择。 该过程翻译成博弈论语言,可抽象为如图1所示的模型。其中: Ⅰ, Ⅱ表示参与人1和2; U表示使用座位, O表示占用座位, F表示针锋相对,而Y表示放弃占有机会。假设使用座位可获效用v, 而先占后用可获额外收益a(a0)。双方争斗时,参与人1获胜的概率为p, 参与人2的获胜概率为1-p。双方蒙受的损失,如丢脸、情绪受影响等,记为c。倘若双方都克制忍让,每一方将有同等机会占有该座位。 2 研究范式的确立 演化博弈论是1980年代发展起来的策略分析方法,其核心思想始于M.Smith的演化稳定概念。它跳出了完全理性人对策选择的研究范式; 分析一群有限理性的个体重复进行某个博弈时,系统整体的行动、规则或策略的分布特征。 策略的演化稳定要求在特定时刻任何少数个体采用其他策略都不比坚持原策略更有效率; 结果原策略个体就没有积极性偏离,而其它行为个体有向既定策略迁移的动机。这表现为社会行为中的某种常识或传统的形成。 2.1 扩大博弈b 分析从图1中的结点③以下的子博弈开始,写成策略形式,如表1所示。 为避免雷同,假设使用该座位的直接效用小于双方争夺可能带来的损失(vc)。 1)pc/(v+c),争斗子博弈有严格占优纳什均衡(F;Y)。此时系统存在唯一的全局子博弈精炼纳什均衡(O,F;Y,Y): 先到者占座,后达者离开; 占座者发现投机者使用他占的座位据理力争,投机者选择退却。这表明当舆论默许占座行为的合法性时,占座者占座,投机者放弃投机成为共识。这种制度安排是演化稳定的。 2)pv/(v+c),争斗子博弈有严格占优纳什均衡(Y;F)。(1)a≤v,此时存在唯一的子博弈精炼纳什均衡(U,Y;U,F): 先到者选择使用策略,一旦进入第二阶段则选择退却,后达者找到座位就利用,等占座者返回时据理力争。(2)av,离开座位去做某事对先到者来说更重要时, 先到者倾向于在第一阶段采用先占后用策略, 一旦博弈进入第二阶段,考虑到舆论对占座持反对态度(p较小), 占座者的最佳策略为收拾东西走人。 后达者相应的均衡策略为: 见到物品占据的座位不妨先利用, 等占座者返回再作理论。 这种情况通常见于明令禁止占座的阅览室。 3)vv+cpcv+c,争斗子博弈存在3个纳什均衡: 纯策略均衡(F;Y),(Y;F)和混合策略均衡(x;y)。其中x=(x1,x2)T,y=(y1,y2)T,且: {x1=12v/[(p-12)v+pc]?y1=12v/[(12-p)v+(1-p)c].(1) 那么博弈究竟是如何进行的呢?上述过程在结构上的不对称性,使得目前的分析技术无法对其进行深入的探讨。为此需要作进一步的假设: 假设该博弈重复发生(与现实相符), 且参与双方以同等概率扮演占座者和投机者,即这次扮演占座者的个体可能在下次遭遇中扮演投机者。这样就可将上述非对称的争斗子博弈G包含在一个更大的对称博弈Г中。 如图2所示,在Г中的第一步是由自然等概率地随机分配进入博弈的两个参与者分别扮演占座者和投机者。扩展博弈Г中的策略是原博弈G中占座者策略和投机者策略的选择性组合; 而支付由两者的期望值综合决定。 不妨以π[σ1,σ2]表示扩展博弈Г中策略σ1和σ2相遇时的支付。需要说明的是, Г中的策略和原子博弈G中的策略对虽然形式相同,含义却不同; 如(F;Y)策略在Г中表示个体扮演占座者时选择针锋相对,而扮演投机者时选择退却。通过运算,不难得到如表2所示的支付关系。 表2中的列对应在位策略,行表示侵入的变异策略,相应的数值表示系统的支付。由于v/(v+c)pc/(v+c),可得(1-p)v-pc0,pv-(1-p)c0; 因此策略(F;Y)和(Y;F)严格占优且演化稳定。此外, π[(Y;Y),(F;F)]π[(F;F),(F;F)]?(2)π[(F;Y),(Y;Y)]π[(Y;Y),(Y;Y)]

文档评论(0)

182****7741 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档