- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章尼姆游戏与动态博弈
* * 第六章 尼姆游戏 6.1尼姆游戏 6.2动态博弈的概念和表示 6.3承诺、威胁与动态博弈 6.4父亲、母亲和孩子三人博弈 如何在尼姆游戏中获胜? 假设有超过2堆(包括2堆)糖果,甲和乙两人轮流从任何一堆中取走若干个糖果,要求:每人每次取到的糖果只能来自其中某一堆,而且至少取一个,取完为止。如果某个人取了糖果之后,正好所有的糖果都被取完了,即他拿了最后一个,那么此人是输家?请问如何获胜? 6.1 尼姆游戏 动态博弈的概念 上述尼姆游戏中,每个参与人均是在另一个人的行动之后,才选择自己的行动的。而之前的博弈中,博弈方均同时选择行动(策略)。这种行动有先后次序的博弈称为动态博弈。 6.2 动态博弈 动态博弈基本特征 博弈方依次选择行为(有时也称为序列博弈,Sequential Games); 每个博弈方的一次选择常称为一个阶段,动态博弈至少有两个阶段,所以也称为多阶段博弈(Multistage Games); 在某个阶段,可能存在几个博弈方同时选择的情况 仿冒和反仿冒博弈 设有一家企业的产品被另一家企业仿冒,如果被仿冒企业采取措施制止,那么仿冒企业就会停止仿冒;如果被仿冒企业不采取措施制止,那么仿冒企业就会继续仿冒。对被仿冒企业来说,被仿冒会造成经济损失,因此采取措施制止仿冒是符合自身利益的,但问题是制止仿冒是有成本(代价)的,因此在遭遇仿冒时是否应该制止是需要研究的问题。对于仿冒企业来说,仿冒不被制止就能够获得很大利益,但如果被制止就会“偷鸡不成反蚀一把米”,因此是否仿冒也要仔细推敲。 动态博弈的扩展形表示法 “仿冒与反仿冒问题”的扩展形表示 用A表示仿冒企业, 用B表示被仿冒企业。 图右中得益数组 的第一个数字表示 仿冒企业(A)的得益, 第二个数字表示被 仿冒企业(B)的得益。 图右称为“扩展形” (Extensive Form), 它特别适合于表示 动态博弈 A B A B 仿冒 不仿冒 仿冒 不仿冒 制止 制止 不制止 不制止 (-2,5) (0,10) (2,2) (10,4) (5,5) “仿冒和反仿冒”博弈的扩展形表示 动态博弈的扩展形表示法 扩展形表示中各符号的含义 圆圈称为“选择节点”或“节点(Nodes)” ; 圆圈中的A、B分别表示节点对应的博弈方。其中,A表示仿冒企业,B表示被仿冒企业; 从节点引出的线条代表博弈方在该处可选择的各种行为或方向; 黑圈表示博弈的终端; 括号中的数字表示博弈方选择相应的“行动路径”到达终端时所得到的得益组合。 动态博弈的扩展形表示法 注解 扩展形表示法形象的体现了动态博弈的“阶段” ; 不是所有动态博弈都可以用扩展形表示。比如:下象棋、打扑克等等 由于动态博弈中,博弈方的行动有先后次序,而不是同时。这时一些博弈方事先的承诺或发出的威胁是否可信会对于博弈的结果有重要的影响,因此,在动态博弈中,如何识别承诺、威胁和许诺的可行性,就成了一个关键问题?更具有实践意识的是如何使得不可信变得可信。 6.3 承诺、威胁与动态博弈 “新年决心” 减肥、偿还债务、省钱、 找份好工作、健身、少喝 酒、戒烟等等。新年决心: 是一个人针对一项任务或 习惯作出的承诺,是改善 恶习的计划。但是计划很难坚持,即不可信!如何使之可信呢? 承诺 你在晚上可能下决心第二天要早起,使一天有个好的开端,但是发现到时间点了,还是要再赖床半小时或一小时,这其实是夜里自己与早晨自己的一个博弈。为了使早起的承诺可信,你想尽办法,比如设闹钟逼自己起床。 早起博弈 承诺没有惩罚措施,想做就做。而威胁则是有条件的,比如父母威胁孩子,“除非吃掉菠菜,否则,不准吃甜点”,劫匪威胁人质“给我100美元,否则敲破你的头”等等,这都是威胁。 威胁 巨大威胁:比如吃饭时,吓唬邻桌的人说:“你要是不把你桌上的盐递给我,就打碎你的头”; 再如上帝的威胁; 腊肠战术。比如母亲强迫你打扫房间,而你一再拖延; 不可信的威胁 电影“洛城机密”中的怀特审问罪犯; 电影“上帝也疯狂”中,审讯袭击者; 这些做法称为边缘政策,为了让对手先动摇,先把他带到灾难的边缘,站在危险的边缘,你威胁说如果他不遵从你的指示,就把他推下去。 边缘政策故意创造风险,小心采用边缘政策! 一种使威胁可信方法 父母在惩罚做了坏事的孩子时,通常面临难题,当父母的威胁不可信时,孩子会有一种预感,他们知道惩罚孩子带个孩子的伤害与父母的一样大,这时该怎么才能让孩子相信“要惩罚作了坏事的孩子”的威胁呢? 6.4父亲、母亲和孩子三人博弈 * * *
文档评论(0)