第08讲博弈论-2详解.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第08讲博弈论-2详解

决策理论与方法 ——博弈论2 合肥工业大学管理学院 * 博弈论 1、博弈论的基本概念 2、完全信息静态博弈 3、完全信息动态博弈 4、不完全信息静态博弈 5、不完全信息动态博弈 完全信息动态博弈 动态博弈(多阶段博弈、序列博弈)指博弈方按一定的次序先后选择博弈策略;完全信息是指对于各种策略组合,各博弈方的得益都是相互已知、透明的。 完全且完美信息动态博弈 重复博弈 有限理性和进化博弈 完全但不完美信息动态博弈 完全且完美信息动态博弈 完美信息是指各博弈方在选择策略前对已经发生的博弈过程完全清楚。 动态博弈表示 扩展形(extensive form)或博弈树 动态博弈表示 策略组合和博弈路径。动态博弈可能包括反复选择策略的多个阶段,不同的策略选择及选择顺序都会对结果产生影响。动态博弈分析就是在已知得益的情况下选择一个策略组合,并与另一方的策略组合形成整个博弈过程,从第一阶段到博弈结束就形成了一条博弈路径。路径上的每一点都有得益分析,路径末端的得益就是博弈结果。 动态博弈的非对称性。先发优势和后发优势。先发可以充分利用环境、信息、资源获取优势,但先发也将自己的策略首先暴露出来,因此后发者也可能制定相应对策而将优势抢回来,正因如此,才能构成博弈。 策略可信性和纳什均衡稳定性 开金矿博弈:甲拥有一个价值4万元的金矿,但无资金(需1万元)开采;乙有资金。甲向乙借资金开采并承诺将金矿分给乙一半。如何博弈? 策略可信性和纳什均衡稳定性 甲是否“分”或乙是否“打官司”都存在可信性问题。 若法律不能给予乙保障,即乙无法打官司,则从个人得益最大化角度考虑,甲就会选择“不分”而获得全部得益;这时乙就会选择“不借”。或者乙可以打官司,但法律没有给予乙合理保障,如打官司的结果是(-1,0),则甲判断乙威胁“打官司”的策略并不可信,这时甲还会选择“不分”。 尽管(2,2)是一个纳什均衡,对应的策略组合是:乙(借,打官司),甲(分)。但打官司的结果决定该纳什均衡是否稳定。 动态博弈方法:逆推归纳法 从动态博弈的最后一个阶段逐步倒推前一阶段的策略选择,直至博弈的开始阶段。 动态博弈方法:逆推归纳法 海盗分钻石:5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城;他们决定这么分: 1、抽签决定自己的号码(1,2,3,4,5) 2、首先,由1号提出分配方案,然后大家5人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼,然后再由2号提出分配方案,以次类推...... 条件:每个海盗都绝顶聪明且很理智 。 问题:第一个海盗提出怎样的分配方案才能够使自己的收益最大化? 子博弈和子博弈完美纳什均衡 子博弈:由一个动态博弈的第一阶段博弈之外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个子博弈。(如采金矿博弈树中虚线框所限定的部分) 子博弈和子博弈完美纳什均衡 子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。它能够排除均衡策略中不可信的威胁或承诺,是一个真正稳定的均衡解。求解方法就是逆推归纳法。 Stackelberg产量博弈模型 设寡头市场上有n个厂商,不同的厂商选择次序不同,不防设厂商i在第i阶段选择,且选择时,前i-1个的产量都已知。求此动态博弈的子博弈完美纳什均衡。设市场出清价为p=a-Q=a-(q1+q2+..+qn), 可变成本为c。 逆推归纳法求均衡解。首先考虑厂商n的决策。 un=qn(a-(q1+q2+...+qn-1+qn))-cqn 由于n在选择时已经知道了前n-1个厂商的产量选择,即q1+q2+...+qn-1=Qn-1是已知量,所以n就是在Qn-1已知下使自身得益最大化,故应满足dun/dqn=0,有: (a-(q1+q2+...+qn-1+qn))-qn-c=0 得: Stackelberg产量博弈模型 再考虑厂商n-1的决策。 它知道前n-2个厂商的产量之和Qn-2以及厂商n的选择策略,因此它的选择也是使自己的得益最大化,即使下式最大: un-1=qn-1*(a-(Qn-2+qn-1+(a-c-Qn-1)/2))-cqn-1 = qn-1*(a-(Qn-2+qn-1+(a-c-Qn-2-qn-1)/2))-cqn-1 得: 依此类推,得第i个厂商的产量选择策略是: Stackelberg产量博弈模型 因此,子博弈完美纳什均衡解是: 它表明随着市场先后进入的厂

文档评论(0)

ee88870 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档