博弈算法【信息技术】.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈算法 朱全民 对策论(博弈论、游戏论或策略论) 田忌赛马 早在战国的时候,中国就流行赛马赌胜的游戏。当时齐国的大将田忌就常常与齐国国君齐威王进行赛马,但每次比赛都是田忌输,齐威王赢。这是什么道理呢?原来田忌上、中、下三等马,齐威王也有上、中丁三等马,但田忌的三等马都分别比齐威王的三等马略差一些。田忌输得很不甘心,又想不出什么好的办法。这时候田忌的谋士孙膑就对田忌说,你再去与齐威王赛一次马,而且把赌注押得多一点,这一次我保证你能赢。田忌素来很信任孙膑,就又去邀齐威王赛马,并且押下了每场比赛一千两黄金的大赌注。比赛开始了,齐威王第一场就派出了它的上等马,田忌刚要派他的上等马去应战,孙膑却不让田忌派上等马,而让他派下等马去应战,结果自然是输了。第二场,齐威王派出中等马,孙膑则让田忌出上等马,结果赢回一场。到了第三场,齐威王只有下等马了。田忌则派出了中等马,结果又赢了一场。三场比赛结束,田忌先输一场,后赢两场,总计还是赢了一场,终于赢到了齐威王的一千两黄金。 二人有限零和对策 首先,参加这个赛局的有两方,一方是田忌,一方是齐威王,所以称“二人策”;其次,田忌有马三等,齐威王也有马三等,双方各用哪一等马去对付对方的哪一等马,其策略个数是有限的,所以又称“有限对策”;最后,每场比赛赌注千金,输方要拿出一千两黄金,而赢方则得到一千两黄金,双方输赢之和恰等于零,所以又称“零和对策”。对于田忌来说,他虽然也有上、中、下三等马,但每等都比齐威王的差,明显地处于劣势的地位。在这样的情况下,如何找到一种最优的策略,使劣势变为优势,就成了田忌能否取胜的关键。 赛马策略 设田忌的三等马为A、B、C,齐威王的三等马为a、b、c。) 很明显,在田忌所有可能采取的六个策略中,有五个都是要输的其中第(1)种输三千两黄金,第(2)(3)(4)(5)种各输一千两黄金只有一个策略,也即是第(6)种策略,才有可能取胜。而孙膑所采取的,正是这个唯一能取胜的策略。我们从他让田忌多下赌注这样有把握的话来看,则可知他对于双方形势的优劣消长,各种策略的利害得失,必然是经过了一番详细的分析和周密的思考的。详细地分析敌我情况,反复地研究各种对策,在所有可能采取的策略中选择一个利多弊少的最优策略,从而使劣势变为优势,最终取得胜利,这正是对策论的基本思想。 一个简单的问题 Grundy博弈 有一堆数目为n的钱币,由两位选手轮流进行分堆,要求每个选手每次只把其中某一堆分成数目不等的两小堆。例如选手甲把n分成两堆后,轮到乙就可以挑其中一堆来分,如此进行下去,直到有一位选手先无法把钱币分成不相等的两堆时就得认输。 状态空间图 与或图 规则:if (x1,…,xn,Max) and (xi=y+z,y z) then (x1,…,xi-1,y,z,xi+1,…,xn,Min) 上图节点A是Max的目标,而节点B,C则是Min的目标。 搜索策略需要考虑的问题是: 对Min走后的每一个Max节点,必须证明Max对Min可能的每一个棋局对弈后能获胜,即Max必须应付Min的所有的招法,这是一个“与” 的含义,因此,含有Max的节点可看成与节点。 对Max走后的每一个Min节点,只须证明Max有一步走赢就可以,即Max只要考虑走一步棋使Min无法招架就成,因此含有Min的节点可看成“或” 节点。 这样对弈过程的搜索图就呈现出“与或图”的形式。 Grundy的与或搜索图 极大极小搜索 博弈程序的任务就是对博弈树进行搜索找出当前最优的一步行棋。对博弈树进行极大极小搜索,可以达到这一目的。极大极小搜索,是因为博弈双方所要达到的目的相反,一方要寻找的利益恰是一方失去的利益,所以博弈的一方总是希望下一走是儿子节点中取值最大者,而另一方恰恰相反。这便形成了极大极小过程。 当然,程序不能也没有必要做到搜索整棵博弈树的所有节点,对于一些已经确定为不佳的走步可以将以它为根节点的子树剪掉。 而且,搜索也不必真地进行到分出胜负的棋局,只需要在一定深度范围内对局面进行评价即可。只有搜索空间缩小到一定程度,搜索才可以真正的进行。当搜索进行到一定深度,用局面评价机制来评价棋局,按照极大极小的原则选出最优,向上回溯,给出这一局面的父亲节点的价值评价,然后再继续向上回溯,一直到根节点,最优走步就是这样搜索出来的 估价函数 极大极小搜索策略是考虑双方对弈若干步之后,从能的走步中选一步相对好棋的着法来走,即在有限的搜索深度范围内进行求解。 为此,要定义一个静态估价函数 f,以便对棋局的势态作出优劣估值,这个函数可根据事态优劣特征进行定义,一般规定有利于Max的势态f(p)取正值,有利于Min的势态f(p)取负值,势均力敌,f(p)=0 因此,f(p)=+∞,表示Max赢, f(p)=

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档