- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在相当多的博弈中,无法使用寻找占优战略和重复剔除劣战略的方法找出均衡解,例如新产品开发博弈中市场需求为低时的情形。 为了找出更一般博弈的均衡解,需要引入Nash均衡(Nash equilibrium)的概念。 定义5 : Nash均衡 在战略式博弈 中,战略组合 是一个Nash均衡当且仅当 , ,有 1.Nash均衡: Nash均衡是1994年诺贝尔经济学奖获得者John Nash在20世纪50年代,作为 n 人战略式博弈的解而提出来的,也是目前一致认可的博弈解。 在传统的博弈论中,一般都将Nash均衡作为博弈的解。 Nash均衡是完全信息静态博弈的解的概念,一个战略组合如果不是Nash均衡解,就不能成为博弈的解。 这意味着构成Nash均衡的战略是不可剔除的,即不存在任何一个战略严格优于Nash均衡战略。 在“囚徒困境”中, (坦白,坦白)为Nash均衡。 在“新产品开发博弈”中, 市场需求大时,(开发,开发)为Nash均衡; 市场需求小时,(开发,不开发)和(不开发,开发)为Nash均衡。 2. 求解Nash均衡的两种方法: 划线法; 箭头法; 1) 划线法 “划线法”就是利用Nash均衡的如下性质:在两人博弈中,相互构成最优战略的战略组合就是Nash均衡。 具体步骤: 考察参与人1的最优战略; 用上述方法找出参与人2的最优战略; 找出最优战略组合。 新产品开发博弈——市场需求小 -4 0 0 , -4 0 0 2 0 0 , 0 0 , 2 0 0 0 , 0 企 业 2 企 业 1 开 发 不 开 发 开 发 不 开 发 (开发,不开发)和(不开发,开发)为Nash均衡 用划线法求解如下博弈 2) 箭头法 “箭头法”则是利用了Nash均衡这样的性质:在两人博弈中,一个战略组合只有在两个参与人都不愿意偏离的情况下才能构成Nash均衡。 具体步骤: 对于每个战略组合,检查是否有参与人会偏离这个战略组合; 直至找出没有参与人会偏离的战略组合。 用箭头法求解该博弈 用箭头法求解该博弈 关于Nash均衡,应注意以下几个问题: Nash均衡有强弱之分; 每一个占优战略均衡、重复剔除的占优均衡一定是Nash均衡,但并非每一个Nash均衡都是占优战略均衡或重复剔除的占优均衡; Nash均衡一定是重复剔除严格劣战略过程中,没有被剔除的战略组合。但没有被剔除的战略组合不一定是Nash均衡,除非它是唯一的; 纳什均衡有可能不唯一:此时哪一个是最优的呢? 纳什均衡会导致不可置信的威胁存在:需要精炼。 考虑如下博弈: 0 , 4 4 , 0 5 , 3 4 , 0 0 , 4 5 , 3 3 , 5 3 , 5 6 , 6 1 2 1 a 2 a 3 a 1 b 2 b 3 b Nash均衡 主要内容: 一、占优行为 二、重复剔除劣战略行为 三、Nash均衡 引例:囚徒困境 “囚徒困境”博弈问题是Tucker在20世纪50年代提出的,该问题不仅“可以作为实际生活中许多现象的一个抽象概括”,而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。 “囚徒困境”(prisoners’ dilemma) 两个小偷作案后被警察抓住,分别关在不同的屋子里审讯。在审讯之前,小偷从律师那里得知:如果两个人都坦白,将被各判刑4年;如果两个人都抵赖,将会因为证据不足而各判1年;如果其中一人坦白另一人抵赖,坦白的将会得到宽大处理而被无罪释放,而抵赖的将被重判(6年)。试问两个小偷将会如何选择? “囚徒困境”(prisoners’ dilemma) 对于每个小偷,当对方坦白时,自己坦白得-4,抵赖得-6,所以,应该选择“坦白”;而当对方抵赖时,自己坦白得0,抵赖得-1,所以,还是应该选择“坦白”。 无论对方如何选择,每个小偷都会选择“坦白”。因此,博弈的结果就是两个小偷都选择“坦白”。 第一个问题 除了(坦白,坦白)以外,“囚徒困境”是否还会出现其它的结果呢? 比如说一个人坦白,另一个人抵赖? 我们说这样的结果也是不会出现的,因为在对方选择“坦白”的情况下,自己选择“抵赖”显然是不理性的。 第二个问题 当两个小偷都选择“坦白”时,是否会有人偏离“坦白”而选择“抵赖” ? 两个小偷只要是理性的,这种情况就不会发生 。 无论对方如何选择,每个小偷都会选择“坦白”,可以发现战略“坦白”具有这样的特点:无论对方怎样选择(选择“坦白”或者“抵赖”),“坦白”总是理性小偷的最优战略。 规律: “囚徒
您可能关注的文档
- 建筑工程质量的重要意义与提升措施学案.ppt
- 构成基础-平构学案.ppt
- 1新三板股权介绍学案.ppt
- 1新型泵车电气系统结构及工作原理(魏-副本-副本学案.ppt
- 1绪论tsh学案.ppt
- 1绪论和基本概念(sun)学案.ppt
- 2财务管理与财务系统教学方案浅析.doc
- 建筑工艺介绍学案.ppt
- 构成要素和分类学案.ppt
- 2第二章厂站遥测变送器浅析.doc
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
文档评论(0)