- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对策论(博弈论)简介 例1:孙膑:田忌赛马 战国时期齐王欲与大将田忌赛马,双方约定每人挑选上、中、下三个等级的马各一匹进行比赛,每局赌金为一千金。齐王同等级的马均比田忌的马略胜一筹,似乎必胜无疑。 田忌的朋友给他出了一个主意,让他用下等马比齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败,反而赢了一千金。 对策论(博弈论)简介 占优均衡与纳什均衡 博弈论小史 1928年,冯·诺依曼证明了博弈论的基本原理(极小化极大定理),标志博弈论诞生。 1944年,冯·诺依曼和摩根斯坦共著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域。 1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)在博士论文中利用不动点定理证明了纳什均衡的存在性 ,从而奠定了这一学科的基础和理论体系。 冯·诺依曼的辉煌人生 John Von Neumann (1903-1957 ) 美籍匈牙利人. 计算机之父,博弈论之父, 量子理论之父. 学习:瑞士苏黎世大学,匈牙利布达佩斯大学 工作:德国柏林大学, 普林斯顿大学 美国国家科学院院士 ,美国数学会主席。 约翰·纳什的跌宕人生 1928生, 数学天才,性格孤僻,行为古怪 本科硕士(三年) Carnegie Mellon University R.J. Duffin推荐信: This man is a genius. 1948 Princeton Univ (导师:Albert Tucker ) 1950 博士论文Non-cooperative Games(27页) 1955 MIT工作 1958妄想型精神分裂症 1964回到Princeton, “我在这里得到庇护,因此没有变成无家可归。” 1978获得冯诺依曼奖(Nash equilibria) 1994年获得诺贝尔经济学奖 现为 Princeton “高级研究数学家” (非正式职位) 2002年 ,来北京出席24届世界数学家大会,《美丽心灵》获得4项奥斯卡金像奖; 2008年,任青岛大学名誉教授。 习题 P411 ex3 一句话小结 共赢是合作的前提。 提出方案之前先要确定原则(公理)。 一些局部看起来合理的方案,事实上可能是违反原则的。 习题 P412ex11 补充题:用协商解和纳什均衡解方法讨论P392“污水处理费用”问题 (3)最小距离解 模型 第i 方的边际效益 若令 3)最小距离解 ? 1)协商解 (4)满意解 di~现状点(最低点) ei~理想点(最高点) 模型 4)基于满意度的解? 1)协商解 (5)Raiffi 解 与协商解x=(5,4,2)比较 求解合作对策的6种方法(可分为三类) Shapley合作对策 A类 B类 协商解 Nash解 最小距离解 满意解 di~现状, ei~理想 B类4种方法相同 例:有一资方(甲)和二劳方(乙,丙), 仅当资方与至少一劳方合作时才获利10元,应如何分配该获利? Raiffi解 C类 B类:计算简单,便于理解,可用于各方实力相差不大的情况;一般来说它偏袒强者. C类: 考虑了分配的上下限,又吸取了Shapley的思想,在一定程度上保护弱者. A类:公正合理;需要信息多,计算复杂. 求解合作对策的三类方法小结 * 第十一章 博弈模型 11.1 进攻与撤退的抉择(非合作对策) 11.5 效益的合理分配 (合作对策) (0,5) (0.5,0.5) (2,2) (5,0) 供认 不供认 嫌疑犯A 不供认 供认 嫌疑犯B 例2:囚徒困境 注:囚徒被分离审查,无法串供 最终会出现什么结局? (5,0)表示(A,B)所判刑期 囚徒困境 每个囚徒都会发现 如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择。 如果对方供认,则自己供认将被判2年,而自己拒供则会被判5年,因此供认是较好的选择。 由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳定结果是两个囚徒都会选择供认(2,2)。这就是博弈的纳什均衡。 攻守同盟(0.5,0.5)? 很难达成:隔离审查,每个人都担心对方背弃盟约。 ⑴ 上策(占优)均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。 ⑵ 纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。 所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。 两个囚徒都会选择供认,不仅是纳什均衡,也是占优均衡。 单一决策主体 决策变量目标函数约束条件 决策主体的决策行为发生直接相互作用 (相互影响) 博弈模型 非合作博弈 合作博弈 三要素 博
文档评论(0)