博弈策略的生活解.pptxVIP

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈策略的生活解读;走近博弈论;我们学习博弈的目的就是通过博弈相关知识及著名的博弈案例,诸如囚徒困境、智猪博弈、斗鸡博弈等等,研究人们如何进行决策,以及这种决策如何达到均衡的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。这门课在一定程度上,是为了提高在校大学生感性认识和理性认识的融合,明白做人做事的???理,掌握分析和处理一些事情的方法和技巧。;一、博弈基础知识;博弈的分类:1、分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。2、分为零和博弈、常和博弈与变和博弈。零和博弈指的是所有博弈方的得益总和为零 。常和博弈则是指所有博弈方的得益总和等于非零的常数。变和博弈则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。 3、分为静态博弈与动态博弈。所有博弈方同时或可看作同时选择策略,采取行动的博弈是静态博弈。 4、分为完全信息博弈与不完全信息博弈。 ;纳什均衡 定义:在给定别人最优的情况下,自己最优选择达成的均衡。 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的 最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。 ;二、囚徒困境;体现囚徒困境基本精神——背叛 形成囚徒困境的机制——担心自己成为傻瓜(处于囚徒困境时,两害相权取其轻) 启示:囚徒困境这个模型,几乎是博弈论的代名词。两个基于“坦白从宽,抗拒从严”审讯的囚徒,从理性的角度出发,会产生怎样的结局?结果却是,从个人理性并追求个人利益最大化,那么二人皆坦白,也就是背叛。这在四种策略中并不占优,那为什么不采用集体最优策略而合作呢?很简单的集体优化,必然侵害个人利益的最大化。当然这一切前提是理性假设,也就是著名的经济人假设:经济学中的人都是“小人”(管理学则认为人是“君子”)。破解这一困境的途径则是打破信息孤立,而执法者的反制则是维持孤立或者加强威胁。无论背叛还是合作,谁在这里面坚持到最后,谁将取胜。;三、重复博弈—合作的开始; 在现实环境中,存在着一些道德因素,可以化解个人理性与群体理性的矛盾,维系整个社会的稳定。 有限次的囚徒困境.情况不同于无限次的囚徒困境的重复博弈。当临近博弈的终点时,采取不合作策略的可能性加大。即使参与人以前的所有策略均为合作策略,如果被告知下一次博弈是最后一次,那么肯定采取不合作的策略。所以要是博弈终点不确定性,只要存在继续合作的机会,背叛就会被抑制。 无名氏定理:博弈中双方合作时得益最大,但若一方不遵守合作约定,必定是另一方合作者吃亏。所以需要引入惩罚机制:谁违约,就要处罚他,使他不敢违约。博弈一方之所以会与另外一位合作,只是因为他知道,如果他今天被骗,明天还能对欺骗实施惩罚。奥曼先生把这一洞察结论称之为“无名氏定理” ; 启示:每一次人际交往其实都可以简化为两种基本选择:合作还是背叛。在人际交往中普遍存在囚徒困境:明知合作能带来双赢,但理性的自私和信任的缺乏导致合作难以产生。而且,如果博弈是一次性,那么必然加剧双方进行“坦白”的决心,选择相互背叛。而现实生活中反复交往的人际关系,则是一种“不定次数的重复博弈”。在较长的视野内,人与人交往关系的重复造成“低头不见抬头见”的关系,可以使交往主体之间走向合作。;4、一报还一报 — 人际交往个体原则;生活中有很多事情,法律和道德不好约束 美国密西根大学学者罗伯特·爱克斯罗德提出了一报还一报策略。他是一个政治科学家,研究方向是人与人之间的合作关系。 研究前提:一、每个人都是自私的;二、没有权威干预个人决策。研究的问题:一、人为什么要合作。二、人什么时候合作、什么时候不合作。三、如何使别人与你合作。;一报还一报策略优点: 1、善良,是指它第一部总是向对方表达善意。它坚持永远不首先背叛对方,开始总是选择合作,而不是一开始就选择背叛或主动作弊。 2、可激怒,是指对方出现背叛行动时,它能够及时识别并一定要采取背叛的行动来报复,不会让背叛者逍遥法外。 3、宽容,是指它不会因为别人一次背叛,长时间怀恨在心

文档评论(0)

老师驿站 + 关注
官方认证
文档贡献者

专业做教案,有问题私聊我

认证主体莲池区卓方网络服务部
IP属地北京
统一社会信用代码/组织机构代码
92130606MA0GFXTU34

1亿VIP精品文档

相关文档