博弈论总结.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
天才的悲哀就在于,他搞懂了规则,却没有搞懂人。他自己想明白了,就想当然的以为别人也会想明白。他不但错误的忽略了只想到人的存在,更忽略了没有思考的,或者存心不按规则玩的人的存在。毕竟,这个世界不是一个只有天才的世界。 博弈论(game theory)是由美国数学家冯·诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。 为什么博弈论会产生如此大的影响呢?这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。 甲或乙可以作出的选择被称为“策略”一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。重复剔除严劣策略均衡重复剔除严格策略就是各参与人在其各自策略集中,不断剔除严劣策略… 如果最终各参与人仅剩下一个策略,则该策略组合就被称为重复剔除严劣策略均衡 重复剔除严劣策略和共同知识 重复剔除严劣策略实质上涉及到了博弈论一个重要假设——理性是共同知识 所谓理性共同知识是指:参与人是理性的,所有参与人知道所有参与人是理性的,所有参与人知道所有参与人知道所有参与人是理性的… 结合重复剔除严劣策略机制,重复剔除的次数越多,对共同知识的要求越严格 定义。对于一个策略式表述的博弈G= {N,Si, ui, i∈N}。称策略组合s*=(s1, …si, …, sn)是一个纳什均衡,如果对于每一个i ∈N, si*是给定其他参与人选择 s-i*={s1*, … ,si-1*, si+1*, … ,sn*} 情况下参与人i的最优策略(经济理性策略),即: ui(si*, s-i*) ≥ ui(si, s-i*), 对于任意的 si∈Si ,任意的 i∈N均成立。 纳什均衡、占优均衡、重复剔除严劣策略均衡的关系 定理a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡,但反过来不一定成立; 定理b 纳什均衡一定不能通过重复剔除严劣策略方法剔除。 纳什均衡的一致预测性质 一致预测性:如果所有参与人都预测一个特定的博弈结果会出现,那么所有的参与人都没有偏离这个结果的愿望,这个预测结果最终将成为博弈的结果。 纳什均衡应用举例:古诺模型 两个企业,分别表示为企业1、企业2 每个企业的策略是选择产量(用qi表示),支付是利润(用πi表示),它是两个企业产量的函数,生产成本与产量有关,用Ci(qi)表示,市场出清价格为P=P(q1+q2) 第i个企业的利润函数为: πi=qi P(q1+q2) – Ci (qi), i=1, 2 (q1*, q2*)是均衡产量意味着: q1*∈argmaxπ1(q1, q2*) q2*∈argmaxπ2(q1*, q2) 根据上面两个式子可以得出反应函数(reaction function): q1*=R1(q2) q2*=R2(q1) 两个反应函数的交叉点就是纳什均衡(q1*, q2*), 于是可得到反应函数为: 进而可以得出每个企业的纳什均衡产量下的利润,为 寡头竞争的总产量大于垄断竞争产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。这是一个典型的囚徒困境 在此之前所说的策略,实质上是以概率1选取某个确定的策略或行动,我们称之为纯策略 利用生活经验不难知道,若硬币是均匀的,以0.5的概率去猜测正面无疑是最佳决策 这就引出了用概率来确定采用何种策略的方法,这就是混合策略(mixed strategies)概念的由来 在博弈G={N, Si, ui, i∈N}中,假设参与人i的纯策略构成的策略集合为Si={si1,…, sik},若参与人i以概率分布pi=(pi1,…, pik) 在其k个可选策略中随机选择“策略”,称这样的选择方式为混合策略。这里,0≤pij ≤ 1,对于j=1 ,…, k都成立,且有, pi1+…+ pik=1 纯策略可看成特殊的混合策略 上述定义是在有限博弈前提下进行的 混合博弈下的纳什策略均衡 基于(v-N-M效用的)策略式博弈由 参与人集合 每个参与人有一个(纯)策略集合 对于每一个参与人来说,由所有参与人纯策略组合构成的风险结果空间,存在一个v-N-M效用 对于博弈G= {N, Si, ui, i∈N},基于v-N-M效用的混合策略组合α*是一个纳什均衡,若对于每一个i, 以及i的任意一个混合策略αi,α*对应的期望支付至少和(αi,α*-i )的期望支付一样大 纳什定理的主要内容为: 在一个有n个参与人的策略式博弈G={S1,…,Sn; u1,…,un}中,如果n是有限的,且Si是有限集(i=1,…,n)

文档评论(0)

638922bb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档