博弈论初步高级管理学章节义.pptVIP

下载本文档

0
0
约2.71千字
约 20页
2018-10-30 发布于湖北
举报
版权申诉

博弈论初步高级管理学章节义.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈论初步高级管理学章节义

School of Economics Management, Tongji University 《高级管理学》第九讲博弈论初步 1囚徒困境和纳什均衡囚徒困境（prisoners’ dilemma）博弈论的著名的例子，纳什均衡是博弈论的重要概念。囚徒困境说的是，两个嫌疑犯作案后被捕，起诉机构没有足够的证据证明他们抢劫了银行。所以，若犯人们不坦白，起诉者只能就非法持有武器罪起诉，判犯人有期徒刑2年。起诉者于是向犯人采取攻心战，说可以“坦白从宽、抗拒从严”。如果一人坦白，则坦白者从宽处理，判徒刑1年，抗拒者从严处理，判徒刑12年。如果两人都坦白，每人依法判徒刑10年。两个囚徒是坦白还是不坦白呢？ 1.1囚徒困境 1.2 博弈均衡博弈论假设博弈的参加者都是理性的，即在对手战略给定的条件下，每个参加者都会选择适当的战略来实现自己报酬的最大化（或损失最小化）。问题是博弈的一方不能控制另一方的决策。当参加者甲以最优战略对付乙的某个战略时，乙会发现原先的战略不是对付甲的实际战略的最佳战略，因而会改变其战略。要是乙改变了战略，参加者甲也要进行相应的改变。这样的改变行为会否停止？这里借用经济学常用的均衡概念，我们把博弈的稳定结果称为均衡，博弈的均衡也称为博弈的解。均衡是指所有的参加者都不想改变战略的状态。 1.3 占优均衡在一些特殊的博弈中，一个参加者的最优战略可能并不依赖于其他参加者的战略选择，也就是说，不论其他参加者选择什么战略，他的最优战略是唯一的，这样的最优战略被称为“占优战略”（dominant strategy）。在上述的囚徒困境博弈中，每个囚徒可选择的战略有两种：坦白与不坦白。显然，不论另外一个囚犯选择什么战略，每个囚犯的最优战略都是“坦白”。例如，如果乙选择坦白，囚犯甲选择坦白时的报酬为-10，选择不坦白的报酬为-12，因而坦白比不坦白好；如果乙选择不坦白，甲坦白的报酬为-1，不坦白的报酬为-2，所以坦白还是比不坦白好。也就是说，“坦白”是囚犯甲的占优战略。由于对称性，“坦白”也是囚犯乙的占优战略。于是，（坦白，坦白）或（-10，-10）是囚徒困境博弈的占优均衡。个人理性与集体理性甲乙两人都寻求最好的结果，而得到的却是较糟的结果。这个例子说明，在多人决策的环境里，个人理性与集体理性经常是矛盾的，这种集体利益和个人利益的之间的冲突被称为“囚徒困境”。 1.4 纳什均衡纳什均衡是这样一种稳定状态，博弈的任何一方参加者都不会改变其战略，如果其他参加者都不改变战略的话。依定义，任何占优战略均衡必定是纳什均衡，但纳什均衡却不一定是占优战略均衡，占优战略均衡是比较强的均衡概念。囚徒困境中的（坦白，坦白）就是纳什均衡。经济生活中的众多集体利益和个人利益的之间的冲突带来的非帕累托有效状态都是纳什均衡。纳什均衡(严格的定义) 完全信息静态博弈的几个著名博弈智猪博弈(boxed pigs) 猪圈里有两头猪，一头大猪，一头小猪，猪圈的一头有个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有10单位的猪食进槽，但谁按按钮谁就要付2个单位的成本。若大猪先到，大猪吃到9个单位，小猪只能吃1个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个单位。标准型支付矩阵性别战（battle of the sexes）市场进入阻挠博弈 2动态博弈静态博弈，即博弈各方同时行动，但是经济生活中许多情形是动态博弈，也就是指博弈参加者的行动有先后顺序，又叫序贯博弈。 2.1完全信息动态博弈的分类博弈总的可以分为完全信息的博弈（即博弈参加者的收益函数是共同知识的博弈）和不完全信息博弈（博弈中的一些参加者不知道其它参加者的收益函数）。完全信息动态博弈又分为完全且完美信息（complete and perfect information）的动态博弈和完全但不完美信息博弈两类。前者是指在博弈进行的每一步当中，要选择行动的参加者都知道这一步之前博弈进行的整个过程；后者是指在博弈的某些阶段，要选择行动的参加者并不知道在这一步之前博弈进行的整个过程 2.2子博弈完美纳什均衡（SPNE）一个子博弈是全部博弈的一部分，当全部博弈进行到任何一个阶段，到此为止的进行过程已经称为博弈参加各方的共同知识，而其后尚未开始进行的部分就是一个子博弈。如果博弈参加者的战略在每一子博弈中都构成纳什均衡，我们称此纳什均衡是子博弈完美纳什均衡（subgame perfect Nash equilibrium）（Selten,1965）。所有动态博弈的中心问题是可信任性，所以不可置信的威胁被研究较多，子博弈完美纳什均衡（SPNE）是不含不可置信的威胁的。子博弈完美纳什均衡可以用逆向归纳法（backwards-

您可能关注的文档

文档评论（0）

kelly + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

博弈论初步高级管理学章节义.pptVIP