- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
囚徒困境 博奕论的基本概念 1、博奕论,Game Theory,是研究决策主体的行为发生直接相互作用的时候的决策以及这种决策的均衡问题的。 从经济学的角度来看,博奕论要解决的问题就是,如果我相信我的竞争者是理性的和追求最大利润的,那么在作我自己的利润最大化决策时,我应该如何考虑它们的行为? 2、参与人:博弈中选择策略以最大化自己的支付水平的决策主体。 3、策略:博弈中参与人每个回合的行动。 4、支付:博弈中每个参与人采取某种策略后获得的效用(报酬)水平。 5、均衡:博弈中,参与的策略不再变化时的情况 “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解” ——保罗·萨缪尔森 现代博弈论简单发展史 起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的《博弈论与经济行为》 博弈论和诺贝尔经济学奖 1994:纳什(Nash)、海萨尼(J.Harsanyi)、泽尔腾(R.Selten) 博弈论和诺贝尔经济学奖 2001:阿克洛夫(Akerlof)、斯宾塞(Spence)、斯蒂格利茨(Stiglitz) 博弈论导论 标准式博弈与扩展式博弈 : 矩阵 树形 (一)囚徒困境1、报酬矩阵 占优策略 不管囚犯B是选择认罪还是不认罪, 囚犯A都会选择认罪! 认罪 是囚犯A的占优策略! 占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略 对于囚犯B 不管囚犯A是选择认罪还是不认罪, 囚犯B都会选择认罪! 认罪 是囚犯B的占优策略! 占优策略(上策)均衡 不管囚犯B是选择认罪还是不认罪, 囚犯A都会选择认罪! 不管囚犯A是选择认罪还是不认罪, 囚犯B都会选择认罪! 认罪 是囚犯A和B的占优策略! 有博弈中,由局中人的上策构成的均衡称为占优策略(上策)均衡 4、广告战 厂商A和B销售相互竞争的产品,并正在决定是否采取广告计划。各个厂商会受到竞争者的决定的影响。其报酬矩阵为下表。其中的数字表示A、B厂商的利润。 各个厂商应该选择什么策略? 5、彩电价格大战 (二)上策均衡的另一种情况 上策均衡的另一种情况 上策均衡的另一种情况 关键点: 寻找占优策略 检查一下你是否存在占优策略,如果有,就选择占优策略 站在对手的位置上思考问题 如果你没有占优策略,那么从你对手角度考虑博弈。如果对手有占优策略,预期他将按占优策略行动 (三)智猪博弈 1、智猪博弈 (三)智猪博弈 1、智猪博弈 考虑消耗后的报酬矩阵 那么,两只猪各会采取什么策略? 比如,在某种新产品刚上市,其性能和功用还不为人所熟识的情况下,如果进行新产品生产的不仅是一家小企业,还有其他生产能力和销售能力更强的企业。那么,小企业完全没有必要作出头鸟,自己去投入大量广告做产品宣传,只要采用跟随战略即可。 “智猪博弈”告诉我们,谁先去踩这个踏板,就会造福全体,但多劳却并不一定多得。 二、纳什均衡1、情侣博弈 情侣的矛盾:其中的数字代表效用。这里双方有没有上策?均衡状态是什么? 2、纳什均衡 三、纳什均衡与上策均衡 第二节 重复博弈与序列博弈 一、重复博弈—价格战 两个企业的经理想最大化利润 策略是低价活动 同步博弈 一次博弈 无限重复博弈 有限重复博弈 1、定价问题 如果企业每年都进行这种一次博弈,并且永远进行下去,这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下,共谋起作用吗?——傻瓜和骗子 密歇根大学爱克斯罗德教授的计算机模拟 他首先邀请全世界的学者递交自认为最优的策略程序,然后将这些策略相互之间交替进行不特定次数的“重复囚徒博弈”,根据最终排名来判定优劣。第一轮14个程序之间的竞赛结果显示,“一报还一报” 的简单策略获得第一。之后,又有63位科学家递交了改进的程序,进行第二轮竞赛,其中包括多个以“一报还一报”策略为基础的改良品种。令人惊异的是,第二轮比赛的优胜者仍然是“一报还一报”。 触发策略 “如果对手在过去没有降价,我就不降价;一旦对手降价,自此以后,我就一直降价来惩罚他” 事实上,只要对手在过去没有过“欺骗”行为,各个企业都会同意“合作”。因为欺骗行为会引发以后所有时期的惩罚 欺骗行为的收益和成本 如果 当前收益 未来成本的现值 欺骗行为是有利的 如果 当前收益 ? 未来成本的现值 欺骗行为没有好处 关键点 当博弈无限重复没有确定的“终结之日”时,共谋作为纳什均衡就能够维持下去 这需要: 有能力监督对手的行动 有惩罚叛徒的能力和名声 在未来进行博弈的机会多 如果博弈有限重复进行,共谋起作用吗? 用逆向归纳法,结论是:不. 在第二阶段,博弈是一次博弈,因此在这最后阶段,均衡是低价
您可能关注的文档
最近下载
- 创新农村公共服务管理模式,推进乡村振兴.pptx VIP
- 学校食堂承包经营及餐饮服务投标方案(技术方案).pdf
- 2022年中国银行公司客户经理考试总题库.doc
- 中国哲学史12-两汉经学.ppt VIP
- 中国康复类医疗器械产业加速腾飞,正迎来黄金发展期——2023大型现状调查报告(先进制造2024前沿第9期).docx
- 电力系统继电保护及安全自动装置运行评价规程 QGDW 10395-2022.docx VIP
- 锚杆静压桩施工设计方案.doc VIP
- 早产儿贫血诊断与治疗的临床实践指南(2025年).pptx VIP
- (高清版)DG∕TJ 08-88-2021 建筑防排烟系统设计标准.pdf VIP
- 《寄生虫学检验》课件——结膜吸吮线虫.pptx VIP
文档评论(0)