博弈论中的几个经典问题.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档 几个博弈论中的经典问题 博弈论 (GameTheory ),亦名 “对策论 ”、 “赛局理论 ”,属应用数学的一个分支, 博 弈论已经成为经济学的标准分析工具之一。 目前在生物学、 经济学、 国际关系、 计算机科学、 政治学、 军事战略和其他很多学科都有广泛的应用。 博弈论主要研究公式化了的激励结构间 的相互作用。 是研究具有斗争或竞争性质现象的数学理论和方法。 也是运筹学的一个重要学 科。博弈论考虑游戏中的个体的预测行为和实际行为, 并研究它们的优化策略。 生物学家使 用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、 策略 (strategies) :一局博弈中, 每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个 可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一 个博弈中局中人都总共有有限个策略,则称为 “有限博弈 ” ,否则称为 “无限博 弈 ” 。 2、 得失 (payoffs) :一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策 略有关。所以,一局博弈结束时每个局中人的 “得失 ” 是全体局中人所取定的一组 策略的函数,通常称为支付( payoff )函数。 3、 次序( orders ):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、 博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买 到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、 纳什均衡 (Nash Equilibrium) :在一策略组合中, 所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略 他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略 的冲动。纳什均衡点存在性证明的前提是 “博弈均衡偶 ”概念的提出。所谓 “均衡 偶 ” 是在二人零和博弈中,当局中人 A 采取其最优策略 a*, 局中人 B 也采取其最优 策略 b*, 如果局中人 B 仍采取 b*, 而局中人 A 却采取另一种策略 a ,那么局中人 A 的支付不会超过他采取原来的策略 a* 的支付。这一结果对局中人 B 亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警 察抓住,隔离审讯;警方的政策是 " 坦白从宽,抗拒从严 " ,如果两人都坦白则各判8年;如 果一人坦白另一人不坦白, 坦白的放出去, 不坦白的判10年; 如果都不坦白则因证据不足 各判1年。 在这个例子里, 博弈的参加者就是两个嫌疑犯A和B, 他们每个人都有两个策略即坦白 和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、 A坦白B不坦白或者B坦白A不坦白, 是博弈的结果。 A和B均坦白是这个博弈的纳什均衡。 这是因为, 假定A选择坦白的话, B最好是选择坦白, 因为B坦白判8年而抵赖却要判十年; 假定A选择抵赖的话, B最好还是选择坦白, 因为B坦白判不被判

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档