北京工业大学选修《博弈论及其在管理中的应用》概念与模型.docx

下载文档 降价啦

0
0
约1.36万字
约 16页
2023-05-02 发布于辽宁
举报
版权申诉
保障服务

北京工业大学选修《博弈论及其在管理中的应用》概念与模型.docx

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

本科生《博弈论及其在管理中的应用》概念与模型-答案叙述由两个人且策略集合为两个元素组成博弈的纳什均衡的定义。（20分）纳什均衡定义：用G=（s「S2；u1,u2）表示一个2人博弈，其中表示第i博弈方的战略集合，匕表示第.博弈方的得益函数，，?=1,2。（5分）如果由各个博弈方的各一个战略组成的某个战略组合（s「,％*）中，任一博弈方i的策略s「，都是对其余博弈方策略组合s；，j丰i，i,j=1,2，的最佳对策，（10分）也即u（s*,s*）u（s,s*）对任意sGS都成立，且u（s*,s*）u（s*,s）对任意1211211212212sGS都成立。则称（s*,s*）为博弈G的一个“纳什均衡”。（20分） 212 两人博弈：甲乙两人博弈，甲有U和D两种策略，乙有L和R两种策略，⑴若甲采取U策略,乙采取L策略，则甲乙得益分别为a和b，记为：（a，b）；（2）若甲采取U策略,乙采取R策略，则甲乙得益分别为c和d，记为：（c，d）；（3）若甲采取D策略,乙采取L策略，则甲乙得益分别为e和f，记为：（e，f）；（4）若甲采取D策略,乙采取R策略，则甲乙得益分别为g和h，记为：（g，h）。问：（i）（U，L）和（D，R）为纯策略纳什均衡的条件是什么？（ii）在①的条件下求该问题的混合策略纳什均衡。（20分）解：两人博弈的得益矩阵如表1所示。表1两人博弈的得益矩阵乙 L R U 他D） (c,d) D (e,f) 0h) 根据纯战略纳什均衡的定义可知，①（U，L）和（D，R）为纯策略纳什均衡的条件是ae,gc,bd和hf；（1）（5分）（ii）记甲以概率a选择U，以概率1—a选D，乙以概率p选择L，以概率1—p选R,其中0a1，0p1。记兀（a,p）和兀（a,p）分别表示甲和乙12的期望收益，则兀（a,p）=a[pa+（1—p）c]+（1—a）[pe+（1—p）g]1兀（a,p）=p[ab+（1—a）f]+（1—p）[ad+（1—a）h]（10分）记。*,P*)为纳什均衡，则根据纳什均衡定义，得。兀(a,B)，—==阮+(1-P)c-[。e+(1-p)g]=0da如(a,p)2=ab+(1-a)f—[ad+(1-a)h]=0dPa*=—J—p*=——(18分)h-f+b-dg-c+a-e混合策略纳什均衡是：甲以概率一=一选择U,以概率一3一选D,h-f+b-dh-f+b-d乙以概率—匚—选择L，以概率一4一选R。(20分)g-c+a-eg-c+a-e 智猪博弈（BoxedPigsGame）（20分）假设猪圈里有两头猪，一头大猪，一头小猪，猪圈的一端有一个猪食槽，另一端安装了一个按钮，控制猪食的供应。按一下按钮，将有10个单位的猪食进入猪食槽，供两头猪食用。两头猪面临两个策略的选择：自己去按按钮或等待另一头猪去按按钮。如果某一头猪做出自己去按按钮的选择，它必须付出如下代价：第一，它需要消耗相当于2个单位的成本；第二，由于猪食槽远离按钮，它将比另一头猪后到猪食槽，从而减少吃食的数量。假定：若大猪先到（小猪按按钮），大猪将吃到9个单位的猪食，小猪只能吃到1个单位的猪食；若小猪先到（大猪场按按钮），大猪将吃到6个单位的猪食，小猪吃到4个单位的猪食；若两头猪同时按按钮，大猪吃到7个单位的猪食，小猪吃到3个单位的猪食；若两头猪同时到（两头猪都选择等待），则两头猪都吃不到猪食。如表4-6所示，对应不同战略组合的支付水平，如两头猪同时按按钮，同时到达猪食槽，大猪吃到7个单位的猪食，小猪吃到3个单位的猪食，扣除2个单位的成本，支付水平分别为5和1。其他情形可以类推。问题：两头猪如何选择各自的最优战略？该模型的得益矩阵如下表4-6所示。无论大猪选择按按钮或等待，小猪选择按按钮都比等待差，这样的战略称为小猪的一个“严格劣战略”，我们首先加以剔除。在剔除小猪按按钮这一选择后的新博弈中，小猪只有等待一个选择，而大猪则有两个可供选择的战略。表2智猪博弈得益矩阵小猪按按钮等待大猪按按钮 (5,1) (4,4) 等待 (9,-1) (0,0) 解：在大猪这两个可供选择的战略中，选择等待对大猪是一个严格劣战略，我们4.猜硬币博弈再剔除新博弈中大猪的严格劣策略（等待）。剩下的新博弈中只有小猪等待、大猪按按钮这一个可供选择的战略，即（按按钮，等待）是智猪博弈的最优均衡解，称为“重复剔除的占优战略均衡”。根据纳什均衡定义，它也是纳什均衡（20 4.猜硬币博弈 -1,1 1,-1 1,-1 -1,1 正面反面表3猜硬币博弈得益矩阵猜硬币方正面反面设博弈方1出正面和反面的概率分别为x和1-x,博弈方2猜正面和反面的概率分别为y和1-y,那么博弈方1出正面和反面的概率x和1-x,一定要使博弈方2猜正面的期望得益和猜反面的期望得益相等,即X—（1—X）=