- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论中的经典分析及启示囚徒困境
引 言 博弈论研究的最大特点 一般决策研究(数学表达): Y = f ( x1, x2, …, xn ) 博弈论的决策研究(数学表达): Y = f ( x1, x2 ,…, xn , z ) (z为他人行为) 特点:决策者目标函数的自变量中包含他人行为。 一、博弈论基础知识 “博弈论”译自英文“Game Theory”。直译:“游戏理论”。 游戏有下列特征: (1)都有规则。 (2)都有结果(赢、输、平),结果能折算成数值。 (3)都有策略或者说计谋,选择不同的策略或计谋 往往带来不同的结果。 (4)策略和利益有相互依存性,即每一个游戏者所 得结果的好坏,不仅取决于自身的策略选择, 也取决于其他参加者的策略选择。 策略本身常常没有绝对的好坏之分,只有相对于 他方策略的相对好坏。 博弈论也称为“对策论”。其实并不是很恰当。因为“对策”在实际中常被用来表示具体的针对性反应方案,或站在某个决策方的立场上找针对其他方的对策。博弈论所研究的决策问题却是有开始、有次序、有结果的整个过程。 “博弈”的通俗含意不过是弈棋、赌胜,但由于它是带有文言性质的词,因而显得学术味浓一些,既能反映这门学科的特点和实质,又给人一种高深莫测的感觉。 博弈的简明定义:博弈即一些个人 或其他组织,面对一定的环境条件,在 一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进 行选择并加以实施,各自取得相应结果 的过程。 博弈论,是研究决策主体的行为发 生直接相互作用时候的决策以及这种决 策的均衡问题。 2. 构成一个博弈的基本要素 博弈的七要素 参与人、行动、信息、战略、支付函数、 结果、均衡。 参与人是博弈中选择行动以最大化自己效用的决 策主体(可以是个人、团体等); 行动是参与人的决策变量; 战略是参与人选择行动的规则,它告诉参与人在什么时候选择什么行动; 信息指的是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识; 支付函数是参与人从博弈中获得的效用水平,是每个参与人真正关心的东西; 结果是指博弈分析者感兴趣的要素的集合; 均衡是所有参与人的最优战略或行动的组合。 博弈的三要素 1) 博弈的参加者 2) 博弈方各自可选择的全部策略 或行动的集合 3) 博弈方的得益 3. 博弈的表述形式 (1) 标准形式(策略形式) (2)扩展形式(博弈树) (3)联盟形式(特殊函数形式) 4. 博弈的类别 博弈的分类表 二、博弈论中的经典分析及启示 “囚徒困境”博弈是1950年图克(Tucker)提出的。它非常简单,却反映了博弈的根本特征,是阐释众多经济社会问题的经典范式。 警察抓住两个罪犯,分别关押,并与罪犯讲清:如果一人坦白,一人抗拒,坦白者立即释放,抗拒者判刑 8 年;若两人都坦白,按律从轻各判 5 年。罪犯知道,他们若抗拒,警察掌握的证据只能各判 1 年。最后的结果会怎样? 纳什均衡:在对方策略确定的情况下,每个参与者的策略都是最好的,没有人愿意先改变自己的策略。 假如博弈中的所有参与人事先达成一项协议,这个协议是否可以自动实施? 若当事人都会自觉遵守这个协议,这个协议就构成纳什均衡:没有人有积极性偏离协议。换句话说,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议。 结论: 一种制度安排要生效,必须是 纳什均衡。不满足纳什均衡要求的制 度没有意义 。 类似囚徒困境 应试教育 公共产品供给不足(修路、公 寓楼道 的路灯) 卡特尔的内在不稳定性产量限制、价格限制) 商业诚信 交通规则 启示: ① 个人理性与集体理性的矛盾; ② 冤假错案是怎样产生的; ③ 个人的最优决策不一定带来集体的最优结果, 集体的最优结果未必来源于个人的最优决策。 领导的政绩? ④ 改变博弈结果的根本方法是改变博弈的支付 矩阵。 囚徒困境的解脱 有这样一个博弈 假如对采取“合作”策略的博弈方奖励3 最终结果为上述两个矩阵相加: ② 惩罚
您可能关注的文档
- samba伺服器的整体环境设定.ppt
- sars模型评价方法将oecd经合组织的良好室规范glp.ppt
- step4step50导入选课具体操作演示.ppt
- thenewacademicstructureinhongkong-中国劳动保障科学研究院.ppt
- tizenv3应用程序描叙和调试-tizenwiki.pdf
- tsp问题蚁群算法通用matlab程序-read.doc
- trswcm内容管理系统-拓尔思.pdf
- twisc@nctudnssec安全性报告-dnssec技术中心.pdf
- uucad胶盒包装结构智能设计与胶盒成本智能分析软件-uucad简介.doc
- vfm60系列数字化涡街流量计-科迈捷.pdf
文档评论(0)