- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 完全信息静态博弈 本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。 完全信息静态博弈的几点特性 同时出招,出招一次;或者,孤立行动,也就是没有关于其他参与者已经或即将行动的信息. 知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的 承诺(非合作) 例子: 商业决策 ;投票选举;罚点球 本章分六节 2.1基本分析思路和方法 2.2纳什均衡 2.3无限策略博弈分析和反应函数 2.4混合策略和混合策略纳什均衡 2.5纳什均衡的存在性 2.6纳什均衡的选择和分析方法扩展 2.1 基本分析思路和方法 2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法 案例:上策均衡 第二次世界大战胜利在望,可是为了给自己捞取功劳,一个飞行大队的指挥官没完没了地下达提高下属的任务定额,弄得所有的人都人心惶惶。 投弹手尤塞里安不想成为胜利前夕的最后一批牺牲品,千方百计逃避任务。他的上级问:“假如,我的士兵都象你这样想,这仗还怎么打?”,可尤塞里安回答到:“那我若不这么想,岂不成了一个大傻瓜? 纳什均衡是一组策略(每个参与者对应其中一个),它使得在其他所有参与者保持该策略组合规定策略时,没有参与者可以通过改变到其他某个可行的策略而收益更多。 注意: 某些策略组合可以不是纳什均衡。 纳什均衡不要求均衡的选择严格好于其他可行的选择。 纳什均衡不要求对于所有参与者加起来最好。 要想使得大家总体上更好,就要求合作行动并使得“欺骗”不可能。 §3 无限策略博弈分析和反应函数 二、反应函数 2.4 混合策略和混合策略纳什均衡 2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 上述博弈的特征是: 在这类博弈中,都不存在纯纳什均衡。 参与人的支付取决于其他参与人的战略;以某种概率分布随机地选择不同的行动 每个参与人都想猜透对方的战略,而每个参与人又不愿意让对方猜透自己的战略。 这种博弈的类型是什么?如何找到均衡? 请举一些这样的例子: 监督博弈 假设你拥有一家便利店。你以周薪 ¥270 雇用了一名员工为你工作。大多数时间里这名员工单独经营这家店。当然,他可能选择勤奋或偷懒。勤奋需付出努力,而努力工作的负效用是 – ¥120。当他偷懒时,负效用为0。如果他选择勤奋,他能为你赚取 ¥600 的利润;但如果他偷懒,你的利润为零。你可以选择不定期去店中视察店中,当然这将花费你 ¥60。你只有在视察店后获得了他偷懒的第一手的证据时(地板没清扫,物品没重新贮藏,打破的咖啡机没有修,等等),你才可以不付薪酬地解聘这个员工。 你期望你的员工如何做?你应该如何做? 为了更好地理解这个案例,让我们对这个情形构建一个标准式博弈。你和你的员工是这个博弈的参与者。你有两个选择:视察或不视察,员工也有两个选择:勤奋或偷懒。你们的选择导致的收益由下列矩阵给出: 这个博弈没有纯策略的纳什均衡。如果你选择视察,则员工会选择勤奋。但如果员工选择勤奋,你就不必去视察。但是如果你不视察,员工会偷懒。而如果员工偷懒,你就应该视察便利店。转了一圈,又回到起点。 混合战略的引入 面对这样的博弈,局中人确定的均衡局势是怎样一种情形。为了进一步分析这种博弈我们引入混合策略的概念 主观概率 当人们面对一个不确定的事物时会对事物发生的可能性有一个主观的估计.这种估计就是主观概率。 事实上我们所认知大部分有关事件发生的概率都是主观概率. 我们在此不讨论主观概率的合理性或正确性,而只想说明主观概率对我们进行决策的重要性. 当人们面对一个不确定的事物时会主观地估计一个主观概率,此时的主观概率只是一种观念,一旦人们相信这种的真实性或不得不接受它的真实性时,这种主观概率就成为人们的一种信念.从而成为人们面对不确定时的一种信念,从而成为人们面对不确定时的决策依据 当一个博弈有多个纳什均衡或没有纳什均衡时,任何一个局中人都无法确知对手的最优选择行为或最优策略。 在这样的博弈中,每个局中人就像面对一种不确定局面一样,在作出决策之前他对不确定的局 面作出主观的估计,形成一种观念。 尔后根据实际的情况修正观念使之成为一种信念,在这种信念的基础上再作出决策。
文档评论(0)