北京工业大学选修《博弈论及其在管理中的应用》概念与模型.docx

北京工业大学选修《博弈论及其在管理中的应用》概念与模型.docx

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本科生《博弈论及其在管理中的应用》概念与模型-答案 叙述由两个人且策略集合为两个元素组成博弈的纳什均衡的定义。(20分)纳什均衡定义:用G=(s「S2;u1,u2)表示一个2人博弈,其中表示第i博弈方的战略集合,匕表示第.博弈方的得益函数,,?=1,2。(5分)如果由各个博弈方的各一个战略组成的某个战略组合(s「,%*)中,任一博弈方i的策略s「,都是对其余博弈方策略组合s;,j丰i,i,j=1,2,的最佳对策,(10分)也即u(s*,s*)u(s,s*)对任意sGS都成立,且u(s*,s*)u(s*,s)对任意1211211212212sGS都成立。则称(s*,s*)为博弈G的一个“纳什均衡”。(20分) 212 两人博弈:甲乙两人博弈,甲有U和D两种策略,乙有L和R两种策略,⑴若甲采取U策略,乙采取L策略,则甲乙得益分别为a和b,记为:(a,b);(2)若甲采取U策略,乙采取R策略,则甲乙得益分别为c和d,记为:(c,d);(3)若甲采取D策略,乙采取L策略,则甲乙得益分别为e和f,记为:(e,f);(4)若甲采取D策略,乙采取R策略,则甲乙得益分别为g和h,记为:(g,h)。 问:(i)(U,L)和(D,R)为纯策略纳什均衡的条件是什么?(ii)在①的条件下求该问题的混合策略纳什均衡。(20分) 解:两人博弈的得益矩阵如表1所示。 表1两人博弈的得益矩阵 乙 L R U 他D) (c,d) D (e,f) 0h) 根据纯战略纳什均衡的定义可知,①(U,L)和(D,R)为纯策略纳什均衡的条件是ae,gc,bd和hf;(1)(5分)(ii)记甲以概率a选择U,以概率1—a选D,乙以概率p选择L,以概率1—p选R,其中0a1,0p1。记兀(a,p)和兀(a,p)分别表示甲和乙12的期望收益,则兀(a,p)=a[pa+(1—p)c]+(1—a)[pe+(1—p)g]1兀(a,p)=p[ab+(1—a)f]+(1—p)[ad+(1—a)h](10分)记。*,P*)为纳什均衡,则根据纳什均衡定义,得。兀(a,B),—==阮+(1-P)c-[。e+(1-p)g]=0da如(a,p)2=ab+(1-a)f—[ad+(1-a)h]=0dPa*=—J—p*=——(18分)h-f+b-dg-c+a-e混合策略纳什均衡是:甲以概率一=一选择U,以概率一3一选D,h-f+b-dh-f+b-d乙以概率—匚—选择L,以概率一4一选R。(20分)g-c+a-eg-c+a-e 智猪博弈(BoxedPigsGame)(20分) 假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有10个单位的猪食进入猪食槽,供两头猪食用。两头猪面临两个策略的选择:自己去按按钮或等待另一头猪去按按钮。如果某一头猪做出自己去按按钮的选择,它必须付出如下代价:第一,它需要消耗相当于2个单位的成本;第二,由于猪食槽远离按钮,它将比另一头猪后到猪食槽,从而减少吃食的数量。假定:若大猪先到(小猪按按钮),大猪将吃到9个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪场按按钮),大猪将吃到6个单位的猪食,小猪吃到4个单位的猪食;若两头猪同时按按钮,大猪吃到7个单位的猪食,小猪吃到3个单位的猪食;若两头猪同时到(两头猪都选择等待),则两头猪都吃不到猪食。如表4-6所示,对应不同战略组合的支付水平,如两头猪同时按按钮,同时到达猪食槽,大猪吃到7个单位的猪食,小猪吃到3个单位的猪食,扣除2个单位的成本,支付水平分别为5和1。其他情形可以类推。问题:两头猪如何选择各自的最优战略? 该模型的得益矩阵如下表4-6所示。无论大猪选择按按钮或等待,小猪选择按按钮都比等待差,这样的战略称为小猪的一个“严格劣战略”,我们首先加以剔除。在剔除小猪按按钮这一选择后的新博弈中,小猪只有等待一个选择,而大猪则有两个可供选择的战略。 表2智猪博弈得益矩阵 小猪 按按钮 等待 大猪 按按钮 (5,1) (4,4) 等待 (9,-1) (0,0) 解:在大猪这两个可供选择的战略中,选择等待对大猪是一个严格劣战略,我们 4.猜硬币博弈再剔除新博弈中大猪的严格劣策略(等待)。剩下的新博弈中只有小猪等待、大猪按按钮这一个可供选择的战略,即(按按钮,等待)是智猪博弈的最优均衡解,称为“重复剔除的占优战略均衡”。根据纳什均衡定义,它也是纳什均衡(20 4.猜硬币博弈 -1,1 1,-1 1,-1 -1,1 正面反面表3猜硬币博弈得益矩阵 猜硬币方 正面反面设博弈方1出正面和反面的概率分别为x和1-x,博弈方2猜正面和反面的概率分别为y和1-y,那么博弈方1出正面和反面的概率x和1-x,一定要使博弈方2猜正面的期望得益和猜反面的期望得益相等,即X—(1—X)=

文档评论(0)

ld555666 + 关注
实名认证
内容提供者

小小鹏鹏

1亿VIP精品文档

相关文档