博弈论的应用-浅析博弈论经典模型.docVIP

下载本文档

17
0
约2.44千字
约 6页
2017-09-04 发布于重庆
举报
版权申诉

博弈论的应用-浅析博弈论经典模型.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论的应用-浅析博弈论经典模型

浅析博弈论经典模型 --囚徒困境模型及其启示一、博弈论概述博弈论又名“对策论”、“赛局理论”，属应用数学的一个分支，表示在多决策主体之间行为具有相互作用时，各主体根据所掌握信息及对自身能力的认知，做出有利于自己的决策的一种行为理论。简单说来就是一些个人或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。由于冲突、合作、竞争等行为是现实世界中常见的现象，因此很多领域都能应用博弈论，例如军事领域、经济领域、政治外交，解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。二、博弈论的基本原理从上述定义中可以看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益、结果、均衡等。 1、参与者指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的事情。 6、均衡是所有参与人的最优策略或行动的组合；均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。上述要素中，参与人、行动和结果统称为博弈规则，博弈分析的目的是使用博弈规则来决定均衡。三、博弈的分类博弈的分类根据不同的标准也有不同的分类。根据参与人的多少，博弈可以分为二人博弈和多人博弈。根据参与人是否合作，博弈可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。根据各方得益的不同情况，博弈可以分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系，争取双赢的局面。根据行为的时间序列性，博弈可以分为静态博弈、动态博弈。静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。根据参与人对其他参与人的了解程度，博弈可以分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。四、纳什均衡假设有n个局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。纳什均衡达成时，并不意味着博弈双方都处于不动的状态，在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态，以下的囚徒困境就是一个例子。五、博弈论的经典模型—“囚徒困境” 这个博弈问题是1950年图克提出的，它虽然非常简单，但却很好地反映了非合作博弈的根本特征，而且这个博弈模型正是解释众多经济现象，研究经济效率问题的非常有效的基本模型和范式。该博弈模型提出后曾引发了大量的相关研究，对博弈论的发展起了不小的推动作用。故事如下：警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押，防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判一年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判10年徒刑；如果两人都坦白认罪，则他们将被各判8年监禁。问：两个罪犯会如何选择（即是坦白还是抵赖）？下面可将整个博弈过程的结果用一矩阵形式表示出来。这种矩阵称为博弈的“得益矩阵（支付矩阵）”。表3.1A与B的得益矩阵囚徒B坦白囚徒B不坦白囚徒A坦白（－8，－8）（0，－10）囚徒A不