博弈论初步文档.docVIP

下载本文档

1
0
约2.33千字
约 6页
2018-02-15 发布于湖北
举报
版权申诉

博弈论初步文档.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论初步文档

博弈论初步博奕论(game theory)又称对策论，是描述、分析多人对策行为的理论，由棋奕、桥牌、战争中借用而来，在经济学中应用广泛，如在用来表现寡头间相互依存的竞争特点便有其突出的优越性。现代经济博奕理论始于1944年冯·诺依曼(John Von Neumann)和莫根施特恩(Oskar Margenston)的《博奕论与经济行为》一书。博弈论就是用数学方法研究决策相互影响的理性人是如何进行决策以获取最大收益的。博奕：多人决策过程引例：田忌赛马博弈论的基本概念囚犯困境(prisoner’s dilemma) 囚徒困境讲的是两个嫌疑犯作案后被警察抓住，分别被关在不同的屋子里审讯。下表给出了囚徒困境模型的表述。每个囚徒都有两种选择：坦白或不坦白。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。博弈的三个基本要素 1、参与者(player)（博奕方、局中人、对局者）：即有哪些人参与博弈。一般至少有两个参与者。可以是个人，团体，集团。 2、策略(strategy) ：参与人在给定信息集的情况下的行动方案。囚徒A、B都只有两种行动可供选择，即“坦白”和“不坦白”。 3、 (payoff)（支付）：博弈的结果给参与人带来的好处。在博弈论中指一个特定策略组合下参与人得到的确定效用水平，或者是指参与人得到的期望效用博弈的分类及其表达方式一、博弈的分类（一）合作博弈与非合作博弈：是否达成协议，是，合作博弈；否非合作博弈。（二）静态博弈与动态博弈、完全信息博弈与不完全信息博弈静态博弈：博弈中，参与人同时选择行动或者虽不同时但后行动者不知道先行动者采取了什么策略的博弈。动态博弈：参与人的行动有先后顺序，且后行动者知道先行动者选择的策略。完全信息博弈：每一个参与人对所有的其他参与人的特征、战略空间及支付有准确的认识，否则就是不完全信息博弈。完全信息静态博弈占优策略均衡（以不变应万变）占优策略：无论其他参与者采取什么策略，某参与者的惟一的最优策略就是他的占优策略。博弈均衡：是指博弈的所有参与者都不想改变自己的策略的这样一种相对静止的状态。占优策略均衡：由博弈中的所有参与者的占优策略所构成的均衡。房地产开发商：市场需求大的开发商而言（开发，开发）是占优策略均衡。囚徒困境的占优策略如果两个疑犯都能够选择不坦白的话，他们将明显地得到一个更大的收益，但由于两人的信息无法沟通，选择不坦白并不是两人的理性选择。对于两人而言，不管对方坦白或是不坦白，自己选择坦白都是更优的选择，因而，{坦白，坦白}就是均衡战略。纳什均衡纳什均衡：在一个纳什均衡里，任何一个参与者都不会改变自己的策略，如果其他参与者均不改变各自的策略。即：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。博弈中双方都没有绝对的最优策略，一方的最优策略取决于对方的选择。囚徒困境的纳什均衡结果——(坦白，坦白)(或(－8，－8))。该结果称为博弈的Nash均衡。 (－1，－1)相对于(－8，－8)为Pareto最优。纳什均衡与占优策略均衡的关系占优策略均衡要求任何一个参与者对于其他参与者的任何选择来说，其最优战略都是唯一的。纳什均衡只要求任何一个参与者的最优战略选择给定的条件下，其选择的战略也是最优的。所以，占优策略均衡一定是纳什均衡，而纳什均衡不一定是占有战略均衡。重复博弈在寡头市场上每个寡头出自个人理性的占优策略却导致了总体和个体利益的下降。在重复博弈（动态博弈的一种）中上述情况有可能改变。无限次重复博弈会走出“囚徒困境”。有限次重复博弈中仍然会存在“囚徒困境”。重复博弈下的合作解重复博弈：是指同样结构的博弈重复多次。如果博弈只是进行了一次，参与人只会关心一次性支付；但如果博弈重复进行，参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。重复博弈分析遵循一个原则“以牙还牙” 有限次重复博弈：相同结构的博弈可以有限次重复进行下去。假设只做5次重复博弈，用逆推法来分析。第5轮博弈，厂商出于理性占有策略会选择不合作的违约行为，在第四轮，每个参与者都知道大家第五轮会选择不合作，所以第四轮也会选择不合作，依次类推到第一轮，仍然选择不合作。所以在有限次重复博弈中，共谋是不稳定的，占有策略均衡是（不合作，不合作）重复博弈下的合作解无限次重复博弈：第一个参与者为了避免“以牙还牙”策略给自己带来的长期损失，都会首先放弃采取不合作策略，寡头厂商们的合作协议可以维持，可以走出囚犯困境。第一个参与者首先选择合作的支付为10+10+10+…,首先选择不合作的支付为12+8+8+…。最终厂商都会选择合作，