- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈考试资料
第二章 囚徒困境与纳什均衡 一、经典案例——囚徒困境 二、现实生活中的“囚徒困境” 三、纳什均衡与优势策略 一、经典案例——囚徒困境 经典案例——囚徒困境 两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”: 如果两人都坦白则各判8年; 如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年; 如果都不坦白则各判1年。 这两个囚犯该怎么办呢?是选择互相合作(不坦白)还是互相背叛(坦白)? 经典案例——囚徒困境 纳什均衡 两人都作出招供的选择,是其优势策略,最符合个体理性的选择。但收益却未必最大,这就是“困境”。 照博弈论的说法,这是本问题惟一的纳什均衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。这一点就是纳什均衡(Nash Equilibrium)。纳什均衡:局中人单独改变策略不会得到好处的对局策略组合。 当博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会最有利的结果。 经典案例——囚徒困境 在“囚徒困境”中表现最好的策略直接取决于对方采用的策略。独立于对方所用策略之外的最好决策是不存在的。 在博弈达到纳什均衡时,在外界环境没有变化的情况下,倘若各方坚持原有的利益最大化原则并理性面对现实,那么这种均衡状况就能够长期保持稳定。 纳什均衡 二、现实生活中的“囚徒困境 ” 现实生活中的“囚徒困境 ” “囚徒困境”是一些非常普遍而有趣的情形的简单抽象。 [明]宋濂《宋文宪公全集》记有一个故事: 玉寅生与三乌丛臣是朋友,他们曾歃血盟誓:“我辈应自励,他日入朝为官,绝不趋炎附势。如有违此誓,请神明惩罚。” 没多久,他们一起到晋国为官。当时赵宣子是晋王宠臣,各大夫均奔走于他家。玉寅生重申以前的誓言,三乌丛臣也说:“说过的话犹在耳畔,岂敢忘记!” 但三乌丛臣后悔当初的誓言,又怕玉寅生知道。于是在一个大清早,鸡刚一报晓,他就前去拜望赵宣子。一进门,他忽然看到东边走廊有个人坐在那里,他走前举灯一照,那个人原来是玉寅生。 现实生活中的“囚徒困境 ” 电信价格竞争的“囚徒困境” 学生的囚徒困境 三、纳什均衡与优势策略 政党的位置博弈 政党的位置博弈 麦当劳与肯德基产品的位置博弈 重复剔除的占优均衡 假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。 在你没有优势策略的情况下,你要做的就是:不能追求最佳,就要避免最差。即剔除所有劣势策略,不予考虑。如此一步一步做下去。 “重复剔除严格劣势策略”(iterated elimination of strictly dominated strategy)的思路:首先找出某博弈方的劣势策略(dominated strategy) ,把这个劣势策略剔除后,剩下的是一个不包含已剔除劣策略的新的博弈;然后在剔除这个新的博弈中的劣策略;继续这个过程,直到没有劣策略存在。 如果剩下的策略组合是唯一的,这个唯一的策略组合就是“重复剔除占优均衡”(iterated dominance equilibrium)。 优势策略的选择——迭代剔除劣势策略 第四章 理性的困境 赵国洪yes.but@163.com 理性的困境 博弈游戏9:分钱博弈 博弈游戏9:分钱博弈 博弈游戏9:分钱博弈 博弈游戏9:分钱博弈 博弈游戏9:分钱博弈 博弈游戏9:分钱博弈 博弈游戏9:分钱博弈 博弈游戏9:分钱博弈 第六章 逆向归纳法:向前展望,从后倒推 赵国洪yes.but@163.com 强盗分赃 强盗分赃 加薪谈判 加薪谈判 加薪谈判 绑架和诚实 绑架和诚实 是否宽恕罪犯? 是否宽恕罪犯? 是否宽恕罪犯? 是否宽恕罪犯? 旅行者困境 “旅行者困境”: 从100到0 魔瓶悖论 魔瓶悖论 博弈游戏8: 饿狮博弈 博弈游戏9: 数数博弈 一、零和博弈 随机策略 游戏3 A向B提议怎样分割100元。如果B接受,这100元就按提议分割,博弈结束。 如果B不同意,则A与B角色互换(即由B提出分配方案,A决定是否接受),但第二轮分割的钱会自动减少10元,即只剩下90元。 请几位同学扮演A和B。 游戏3 假设第一轮中A向B提议分给B30元,B应否接受? B不应接受,因为第二轮时B可以接议分给A45元,则自己可获得45元。 所以第一轮中A应该根据逆向归纳法来确定分配方案,确保B在第一轮中接受提议(即要向前展望,预测B在第二轮会提出什么方案)。 这个游戏与前面两个游戏不同之处便是这个游戏不再与自己的自尊或不公平感等情感因素相关。 游戏4 如果还有第三轮呢?(即第二轮A拒绝,则进入第三轮,重新由A提出分配方案)
文档评论(0)