博弈论原理教学.ppt

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
补充章 博弈论 (Game Theory) 在博弈论研究获诺贝尔奖经济学奖的大师 Adam Smith was wrong! 第一节 博弈论形成与发展 1944年约翰·冯·诺依曼与奥斯卡·摩根斯坦合著的《博弈论与经济行为》 当代博弈论的“三大家”和“四君子”: “三大家”:约翰·福布斯·纳什、约翰·C·海萨尼,以及莱因哈德·泽尔腾。三人同时获得1994年的诺贝尔经济学奖。 “四君子”:罗伯特·J·奥曼、肯·宾摩尔、戴维·克瑞普斯,以及阿里尔·鲁宾斯坦 第二节 博弈论的基本概念 1、定义 是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。 博弈:一些相互依赖、相互影响的决策行为及其结果的组合。 2、博弈论对人的基本假定: 人是理性的(rational),博弈论研究的是理性的人之间如何进行策略选择。 3、博弈的组成要素 (1)参与人(players):指的是一个博弈中的决策主体,他的目的是通过选择行动或战略以最大化自己的支付(效用)水平。 (2)行动(actions or moves):是参与人在博弈的某个时点的决策变量。   (3)策略(strategies):策略(strategies):参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。 (4)支付(payoffs):是指一个特定战略组合下参与人得到的确定效用水平,或者是他得到的期望效用水平。 (5)均衡:在经济学中,均衡意即相关量处于稳定值。所谓纳什均衡,它是一稳定的博弈结果,是所有参与人的最优战略的组合。 4、博弈的分类   合作博弈和非合作博弈 完全信息博弈和不完全信息博弈 有限博弈和无限博弈 静态博弈和动态博弈 合作博弈和非合作博弈 合作博弈和非合作博弈的区别在于人们的行为相互作用时,当事人能不能达成一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 完全信息博弈和不完全信息博弈 信息(information):参与人有关博弈的知识,包括有关自然的选择、其他参与人的特征和行动的知识。 完美信息(perfect information ):指一个参与人对其他参与人(包括虚拟参与人“自然)的行动选择有准确了解的情况. 完全信息(complete information ):指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,也就是没有事前的不确定性。 有限博弈和无限博弈 如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,比如我只有买或者不买两种策略,否则称为“无限博弈”。 第三节 完全信息静态博弈 个人理性与集体理性的冲突 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。 现象 : 鹬蚌相争 、公共产品、价格战、军备竞赛、污染 …… 智猪博弈        小猪      按    等待 大猪  按 5,1    4,4    等待 9,-1   0,0 性别战博弈 女 足球赛 肥皂剧    足球赛 (2,1 ) (0,0)    男 肥皂剧 (0,0) (1,2)    斗鸡博弈 乙 前进 后退    前进 (-2,-2) (1,-1)    甲 后退 (-1,1) (-1,-1)   行动与策略 战略与行动的区别:战略是行动的规则。 在完全信息静态博弈中,由于每个人是在不知其他人行动的情况下选择自己的行动,没有先后顺序问题,所以战略和行动是一回事。 次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;所有其他要素相同,但次序不同,博弈就可能会不同。 斯坦克尔伯格寡头竞争模型 企业1为领头企业,他首先来选择产量q10,企业2是尾随企业,在观测到企业1的选择后,再来选择自己的产量q20。 逆需求函数P(Q)=a-q1-q2 利润函数为:兀i=qi[P(Q)-c] 给定q1,企业2的最优选择是:max兀2=q2(a-q1-q2-c) 利润最大化:q2=1/2(a-q1-c)??? 代入q2 ,得企业1的收益: max兀1=q1[a-q1-1/2(a-q1-c)-c] 企业1利润最大化:q1=1/2(a-c) 企业2利润最大化: q2=1/4(a-c). 私奔博弈 (1)不可置信威胁 (2)重复博弈 质量

文档评论(0)

liuxing044 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档