第二章节囚徒困境与纳什均衡.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 囚徒困境与纳什均衡 赵国洪yes.but@163.com 一、经典案例——囚徒困境 二、现实生活中的“囚徒困境” 三、纳什均衡与优势策略 一、经典案例——囚徒困境 克格勃的小花招 在前苏联,有一位乐队指挥在火车上翻看乐谱时,两名克格勃(KGB,苏联国家安全警察)将他作为间谍逮捕了。他们以为那乐谱是某种密码,这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲,却无济于事。 第二天,审问者自鸣得意地走进来说:“我看你还是老实招了吧,我们已经抓住了你的朋友柴可夫斯基了,他这会儿正向我们交代呢。你如果再不招就枪毙了你。如果交代了,只判你10年。” 经典案例——囚徒困境 两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”: 如果两人都坦白则各判8年; 如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年; 如果都不坦白则各判1年。 这两个囚犯该怎么办呢?是选择互相合作(不坦白)还是互相背叛(坦白)? 经典案例——囚徒困境 博弈游戏:囚徒困境 纳什均衡 两人都作出招供的选择,是其优势策略,最符合个体理性的选择。但收益却未必最大,这就是“困境”。 照博弈论的说法,这是本问题惟一的纳什均衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。这一点就是纳什均衡(Nash Equilibrium)。纳什均衡:局中人单独改变策略不会得到好处的对局策略组合。 当博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会最有利的结果。 经典案例——囚徒困境 在“囚徒困境”中表现最好的策略直接取决于对方采用的策略。独立于对方所用策略之外的最好决策是不存在的。 在博弈达到纳什均衡时,在外界环境没有变化的情况下,倘若各方坚持原有的利益最大化原则并理性面对现实,那么这种均衡状况就能够长期保持稳定。 纳什均衡 纳什均衡的思想 纳什均衡的思想 二、现实生活中的“囚徒困境 ” 现实生活中的“囚徒困境 ” “囚徒困境”是一些非常普遍而有趣的情形的简单抽象。 [明]宋濂《宋文宪公全集》记有一个故事: 玉寅生与三乌丛臣是朋友,他们曾歃血盟誓:“我辈应自励,他日入朝为官,绝不趋炎附势。如有违此誓,请神明惩罚。” 没多久,他们一起到晋国为官。当时赵宣子是晋王宠臣,各大夫均奔走于他家。玉寅生重申以前的誓言,三乌丛臣也说:“说过的话犹在耳畔,岂敢忘记!” 但三乌丛臣后悔当初的誓言,又怕玉寅生知道。于是在一个大清早,鸡刚一报晓,他就前去拜望赵宣子。一进门,他忽然看到东边走廊有个人坐在那里,他走前举灯一照,那个人原来是玉寅生。 现实生活中的“囚徒困境 ” 囚徒与战士 约瑟夫·海勒《第22条军规》的一个故事: 第二次世界大战胜利在望,投弹手尤塞里安不想成为胜利前夕最后一批牺牲者,千方百计逃避执行任务。他的上级军官问:“可是,假如我方士兵都这么想呢?”可尤塞里安答道:“那我若是不这么想,岂不就成了一个大傻瓜?” 政客的囚徒困境 电信价格竞争的“囚徒困境” 学生的囚徒困境 盗版书的“囚徒困境” 国家军备竞赛的“囚徒困境” 军事博弈 博弈游戏4 三、纳什均衡与优势策略 政党的位置博弈 政党的位置博弈 麦当劳与肯德基产品的位置博弈 新闻大战与优势策略 新闻大战与优势策略 新闻大战与优势策略 新闻大战与优势策略 新闻大战与优势策略 新闻大战与优势策略 新闻大战与优势策略 优势策略 新闻大战与优势策略 新闻大战与优势策略 重复剔除的占优均衡 假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。 在你没有优势策略的情况下,你要做的就是:不能追求最佳,就要避免最差。即剔除所有劣势策略,不予考虑。如此一步一步做下去。 “重复剔除严格劣势策略”(iterated elimination of strictly dominated strategy)的思路:首先找出某博弈方的劣势策略(dominated strategy) ,把这个劣势策略剔除后,剩下的是一个不包含已剔除劣策略的新的博弈;然后在剔除这个新的博弈中的劣策略;继续这个过程,直到没有劣策略存在。 如果剩下的策略组合是唯一的,这个唯一的策略组合就是“重复剔除占优均衡”(iterated dominance equilibrium)。 囚徒困境的占优均衡 优势策略的选择——迭代剔除劣势策略 重复剔除的占优均衡 性别博弈 博弈游戏5:选举游戏 信徒的囚徒困境 从前,有两位很虔诚的信徒,他们是好朋友,他们决定一块到很远圣山朝圣。 在路上,遇见一位老人,老人对他们说:“从这里到圣山还有两星期的路程。如果你们想早日到达的话,我可以送你们一个礼物,就是你们当中一个人先许愿

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档