2013博弈论题稿.pptVIP

下载本文档

14
0
约 45页
2017-03-11 发布于湖北
举报
版权申诉

2013博弈论题稿.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

囚徒困境博奕论的基本概念 1、博奕论，Game Theory，是研究决策主体的行为发生直接相互作用的时候的决策以及这种决策的均衡问题的。从经济学的角度来看，博奕论要解决的问题就是，如果我相信我的竞争者是理性的和追求最大利润的，那么在作我自己的利润最大化决策时，我应该如何考虑它们的行为？ 2、参与人：博弈中选择策略以最大化自己的支付水平的决策主体。 3、策略：博弈中参与人每个回合的行动。 4、支付：博弈中每个参与人采取某种策略后获得的效用（报酬）水平。 5、均衡：博弈中，参与的策略不再变化时的情况 “要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解” ——保罗·萨缪尔森现代博弈论简单发展史起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的《博弈论与经济行为》博弈论和诺贝尔经济学奖 1994：纳什（Nash）、海萨尼（J.Harsanyi）、泽尔腾（R.Selten）博弈论和诺贝尔经济学奖 2001：阿克洛夫（Akerlof）、斯宾塞（Spence）、斯蒂格利茨（Stiglitz）博弈论导论标准式博弈与扩展式博弈 : 矩阵树形（一）囚徒困境1、报酬矩阵占优策略不管囚犯B是选择认罪还是不认罪, 囚犯A都会选择认罪! 认罪是囚犯A的占优策略! 占优策略（上策）不管对手做什么，对一个参与者都能获得最高得益的策略对于囚犯B 不管囚犯A是选择认罪还是不认罪, 囚犯B都会选择认罪! 认罪是囚犯B的占优策略! 占优策略（上策）均衡不管囚犯B是选择认罪还是不认罪, 囚犯A都会选择认罪! 不管囚犯A是选择认罪还是不认罪, 囚犯B都会选择认罪! 认罪是囚犯A和B的占优策略! 有博弈中，由局中人的上策构成的均衡称为占优策略（上策）均衡 4、广告战厂商A和B销售相互竞争的产品，并正在决定是否采取广告计划。各个厂商会受到竞争者的决定的影响。其报酬矩阵为下表。其中的数字表示A、B厂商的利润。各个厂商应该选择什么策略？ 5、彩电价格大战（二）上策均衡的另一种情况上策均衡的另一种情况上策均衡的另一种情况关键点：寻找占优策略检查一下你是否存在占优策略，如果有，就选择占优策略站在对手的位置上思考问题如果你没有占优策略，那么从你对手角度考虑博弈。如果对手有占优策略，预期他将按占优策略行动（三）智猪博弈 1、智猪博弈（三）智猪博弈 1、智猪博弈考虑消耗后的报酬矩阵那么，两只猪各会采取什么策略？比如，在某种新产品刚上市，其性能和功用还不为人所熟识的情况下，如果进行新产品生产的不仅是一家小企业，还有其他生产能力和销售能力更强的企业。那么，小企业完全没有必要作出头鸟，自己去投入大量广告做产品宣传，只要采用跟随战略即可。 “智猪博弈”告诉我们，谁先去踩这个踏板，就会造福全体，但多劳却并不一定多得。二、纳什均衡1、情侣博弈情侣的矛盾：其中的数字代表效用。这里双方有没有上策？均衡状态是什么？ 2、纳什均衡三、纳什均衡与上策均衡第二节重复博弈与序列博弈一、重复博弈—价格战两个企业的经理想最大化利润策略是低价活动同步博弈一次博弈无限重复博弈有限重复博弈 1、定价问题如果企业每年都进行这种一次博弈，并且永远进行下去，这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下，共谋起作用吗？——傻瓜和骗子密歇根大学爱克斯罗德教授的计算机模拟他首先邀请全世界的学者递交自认为最优的策略程序，然后将这些策略相互之间交替进行不特定次数的“重复囚徒博弈”，根据最终排名来判定优劣。第一轮14个程序之间的竞赛结果显示，“一报还一报” 的简单策略获得第一。之后，又有63位科学家递交了改进的程序，进行第二轮竞赛，其中包括多个以“一报还一报”策略为基础的改良品种。令人惊异的是，第二轮比赛的优胜者仍然是“一报还一报”。触发策略 “如果对手在过去没有降价，我就不降价；一旦对手降价，自此以后，我就一直降价来惩罚他” 事实上，只要对手在过去没有过“欺骗”行为，各个企业都会同意“合作”。因为欺骗行为会引发以后所有时期的惩罚欺骗行为的收益和成本如果当前收益未来成本的现值欺骗行为是有利的如果当前收益 ? 未来成本的现值欺骗行为没有好处关键点当博弈无限重复没有确定的“终结之日”时，共谋作为纳什均衡就能够维持下去这需要: 有能力监督对手的行动有惩罚叛徒的能力和名声在未来进行博弈的机会多如果博弈有限重复进行，共谋起作用吗? 用逆向归纳法，结论是：不. 在第二阶段，博弈是一次博弈，因此在这最后阶段，均衡是低价