- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三讲 动态博弈与逆向归纳法
《趣味博弈论》 杨驭云 华南师范大学南海校区 第三讲 动态博弈与逆向归纳法 动态博弈 博弈的本质在于各参与者的决策相互依存,这种相互作用或者互动通过两种方式体现出来。 第一种方式:参与者同时行动或者虽非同时行动,但后行动者并不知道先行动者的选择。比如石头、剪刀、布,还有囚徒困境。 这一类博弈称为静态博弈。 第二种方式:参与者的行动有先后顺序,后行动者可以观察到先行动者做了什么选择,先行动者的选择影响后行动者的选择空间。 此类博弈称为动态博弈。 21支旗游戏 美国哥伦比亚广播公司的电视真人秀节目《Survivor 》(幸存者)中有这样一个游戏: 地面插着21支旗,两个人轮流移走这些旗。每个人在轮到自己时可以选择移走1支、2支或3支旗。拿走最后1支旗的人获胜,无论这支旗是最后1支,还是2支或3支中的一支。 请大家两两配对来玩这个游戏,轮流充当先行者。时间为10分钟。 你是跟着感觉走来玩这个游戏吗? 你是否发现越玩到后面、剩下的旗越少的时候就越清晰地知道自己正确的策略是什么? 那就让我们向前展望、倒后推理,即面向未来,思考现在,站在未来的立场来确定现在的最优行动。 倒数第二步,你必须留给对方4支旗。 倒数第三步,你必须留给对方8支旗。 依此类推,你必须依次给对方留下12、16、20支旗来确保取胜。 所以,在这个游戏中,先行者能确保取胜。 但如果游戏开始时是20支旗,那么后行者能确保取胜。 这是一个典型的完全完美信息动态博弈。 完全信息:每个参与者的策略集合及收益函数均为博弈各方的共同知识。 完美信息:每个参与者都知道先前行动的参与者采取了什么策略。 序贯理性 序贯理性:每个参与者在其每一个决策时点上都将重新优化自己的选择,并且会把自己将来会重新优化其选择这一点也纳入当前的优化决策当中。 在序贯理性下不会有“后悔”出现。 “每个参与者是序贯理性的”是博弈的共同知识。 逆向归纳法 逆向归纳法:按与博弈进行顺序相反的方向逐一找出每个参与者在其所有决策时点上的最优策略选择,直到第一个决策时点为止。 “每个参与者是序贯理性的”是逆向归纳法的基础。 索马里海盗人力资源部招聘启事 你忍心蜗居在不到10平米的小屋里吗?你忍心看着自己的女友和你奋斗一辈子还供不起一套房吗?你忍心看着父母缩衣节食把仅有的一点养老金帮你还房贷吗? 这里才是实现你梦想的地方。加入我们,待遇从优,装备齐全,食宿全免,一条大裤衩,一双人字拖,一把AK47,800美元底薪+提成,全天移动式海景套房,多劳多得。只要大干一票,在大都市买楼不再是梦想;干两票,跻身上层社会,直接与奥巴马对话不再是距离。别再犹豫了,给你一片海域,换你一生奇迹! 海盗分金 有10名海盗抢得了100块金子,并打算瓜分这些战利品。这是一些讲民主的海盗,也就是遵循少数服从多数原则,他们按照习惯的方式进行分配:最厉害的一名海盗提出分配方案,然后所有的海盗包括提出方案本人就此方案进行表决。如果半数以上(含半数)的海盗赞同这一方案,那么这一方案就获得通过并按照这一方案进行战利品的分配;否则,提出方案的海盗将被扔进海里喂鲨鱼,然后剩余海盗中最厉害的海盗又重复上述过程。。。 假设:没有两名海盗是同等厉害的;这些金块不能再分,也不允许几名海盗共有1块金子。 那么,最厉害的一名海盗应该提出什么样的分配方案呢? 考虑到分析的便利,这里按照这些海盗能力的差异给他们编上序号。最怯懦的海盗为1号海盗,次怯懦的海盗为2号海盗,依此类推,最厉害的海盗为10号海盗。 海盗们基于三个因素来做决定:首先,自己要能存活下来;其次,自己得到的利益最大化;最后,在所有其它条件相同的情况下,优先选择把别人扔进海里。 这些海盗残酷的分配规则给人的第一印象是:最厉害的那名海盗是个多么不幸的人啊!因为作为头一个提出方案的人,仅仅能活下来的机会都微乎其微:即使他自己一分不要,把金子全部送给另外9人,那些人可能也不赞同他的分配方案,那么他只有死路一条! 真的是这样吗? 任何一个海盗想让自己的方案获得通过的关键是事先考虑清楚“继承者”的分配方案是什么,然后拉拢“继承者”分配方案中最不得意的人们,争取用最小的代价获取最大收益
您可能关注的文档
最近下载
- 招标考察作业标准及流程.docx VIP
- 专题15 议论文阅读(原卷版)2025年中考语文真题分类汇编(全国通用).docx VIP
- (完整版)三基三严考试题题库(附含答案).docx
- 专题12.28 添加辅助线构造三角形全等的十四种方法(题型梳理与方法分类讲解)(人教版)(学生版) 2024-2025学年八年级数学上册基础知识专项突破讲与练(人教版).docx VIP
- 2024创新十年未来十年-致敬中国生物医药创新奋斗者们.pdf VIP
- 广东省茂名市化州市2024-2025学年高一上学期11月期中生物试题【含答案解析】.docx VIP
- 将军饮马模型-将军饮马的数学模型.pdf VIP
- 高中语文散文阅读知识点思维导图.docx VIP
- 关于成立工程质量管理领导小组的通知.docx VIP
- 高中英语2025届高考高频词汇(共 688个 ).doc VIP
文档评论(0)