- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从“囚徒困境”理解博弈论
【摘要】:根据老师的名言“在当今时代,学习了博弈论,就能够成为一位有深度的智者。”因而本文通过介绍博弈论的相关概念及其引申内容,借助纳什均衡所精炼出的策略组合,剖析博弈论中的经典模型,加强对博弈论这一独特思想分支的理解与领悟。
【关键词】:博弈论,纳什均衡,经典模型,理解。
一、什么是博弈论
博弈论,又叫做游戏理论或对策论,是一门以数学为基础,研究对抗冲突中最优解问题的学科。谈到博弈,首先想到的肯定就是棋盘上的对弈,其实博弈论最初主要是研究象棋、桥牌、赌博中的胜负问题,只是人们对博弈局势的把握只停留在经验上,没有向理论化发展。而现如今,只要有存在竞争、存在输赢的局面出现,就可以应用到博弈论。因为在很多层次的格局中,对于决策层来说,正确有效地做出合理的决策一定能够产生决定性因素,而博弈论正是运用在这个过程中的核心方法。
二、博弈论中的纳什均衡
博弈论从本质上来讲是研究决策问题.但与传统的决策分析相比,博弈论更加关注的是博弈决策中博弈各方的互动行为。这是由于每一场竞争的竞争结果依赖于所有局中人的抉择,每个局中人都企图预测其他人的可能抉择, 以确定自己的最佳对策。所以在博弈论的研究中,关注每个人的均衡问题就成为了核心。
约翰·纳什(John Nash)分别在1950年与1951年发表了《n人博弈中的均衡点》和题为《非合作博弈》两篇论文。在上述论文中,纳什介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,并证明了均衡解的存在。论文刊登在美国全国科学院每月公报上后,引起巨大轰动,因此该解概念后来被称为纳什均衡。以两家公司的价格大战为例,平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是平衡。有两个小偷A和B联合、私入民宅被警察抓住。
对于这个案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。如果从两个人承受的罪责总和来看,两个人加起来只是被判了2年,相比于其他三种情况都从轻了。但是由于两人处于隔离的情况,所以首先应该是从心理学的角度来看,双方都会怀疑对方会出卖自己以求自保,所以有很大的可能会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。对于一个面临要坐牢的罪犯来说,释放的诱惑力永远大于被判刑,无论是10年8年,甚至只有1年,因此在这个过程中,某一方的小偷一定会在考虑到得到被释放的机会同时,忽略掉对方的处境。综合以上几种情况考虑,不管对方坦白与否,对自己而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
但是在这个例子里,纳什均衡就是(坦白,坦白)。若B抵赖,A坦白的话则A被释放,抵赖的话被判1年,所以坦白比抵赖好:若B坦白,A坦白的话被判8年,抵赖的话被判10年,所以坦白还是比抵赖好。所以可以得出:在给定B坦白的情况下,A的最优策略是坦白,同理,给定A坦白的情况下,B的最优策略也是坦白。实际上,这里的(坦白,坦白)不仅是纳什均衡,而且是一个占优策略均衡,就是说,不论对方如何选择,个人的最优选择都是坦白。因而坦白既是A的占优策略,又是B的占优策略,结果是每个人都选择坦白,各判8年。
“囚徒困境”反映了个人理性与集体理性的矛盾,虽然两个都抵赖各判刑1年显然比都坦白各判刑8年好,但是这种选择不满足个人利己心理学的要求,即(抵赖,抵赖)不是纳什均衡。这也印证了上述的纳什平衡意味着两败俱伤的可能
搀扶 不搀扶 讹诈 (1,-1) (-2,0) 不讹诈 (0,1) (-2,0)
摔倒者
囚徒困境假定每个参与者都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略成为劣势,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
那么在这种情况下,路人搀扶而摔倒者不讹诈对于双方来说是最佳策略。但是对于摔倒者来说,在路人搀扶行动不变的情况下,讹诈的收益1要高于不讹诈的收益0;而路人肯定是清楚这一点的,所以在摔倒者讹诈行动不变的情况下,路人搀扶的收益-1要低于不搀扶的收益0。因此,在不完全信息情况下,路人和摔倒者会选择共同受益最低的策略(讹诈,不搀扶)。
如此看来,在这个经典模型下,我们所得到的策略是非常失败的。因为如果在案例中加上社会道德、法律法规的约束条件,摔倒者的讹诈是欺诈
您可能关注的文档
最近下载
- 应用型本科转型下《理论力学》课程的改革与探索.docx VIP
- 宫颈病变治疗与护理.pptx
- 应用型普通本科理论力学教学教改分析与探讨.pdf VIP
- GJB9001C-2017 标准理解与实施培训PPT教材.ppt
- 青岛版小学科学四年级上册一、二单元教材分析解读.pptx VIP
- 急救心理援助与安抚ppt课件.pptx
- 应急救援中的心理援助与疏导.pptx VIP
- 股市主力操盘盘 口摩斯密码(原创内容,侵权必究).pptx
- 小学班队管理(第2版)课件全套 第1--6章 小学班队与班队管理---小学班队环境管理.pptx
- 2025四川农商银行社会招聘800人笔试备考题库及答案解析.docx VIP
文档评论(0)