博弈算法【信息技术】.pptVIP

下载本文档

15
0
约5.12千字
约 42页
2012-03-19 发布于北京
举报
版权申诉

博弈算法【信息技术】.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

博弈算法朱全民对策论(博弈论、游戏论或策略论) 田忌赛马早在战国的时候，中国就流行赛马赌胜的游戏。当时齐国的大将田忌就常常与齐国国君齐威王进行赛马，但每次比赛都是田忌输，齐威王赢。这是什么道理呢？原来田忌上、中、下三等马，齐威王也有上、中丁三等马，但田忌的三等马都分别比齐威王的三等马略差一些。田忌输得很不甘心，又想不出什么好的办法。这时候田忌的谋士孙膑就对田忌说，你再去与齐威王赛一次马，而且把赌注押得多一点，这一次我保证你能赢。田忌素来很信任孙膑，就又去邀齐威王赛马，并且押下了每场比赛一千两黄金的大赌注。比赛开始了，齐威王第一场就派出了它的上等马，田忌刚要派他的上等马去应战，孙膑却不让田忌派上等马，而让他派下等马去应战，结果自然是输了。第二场，齐威王派出中等马，孙膑则让田忌出上等马，结果赢回一场。到了第三场，齐威王只有下等马了。田忌则派出了中等马，结果又赢了一场。三场比赛结束，田忌先输一场，后赢两场，总计还是赢了一场，终于赢到了齐威王的一千两黄金。二人有限零和对策首先，参加这个赛局的有两方，一方是田忌，一方是齐威王，所以称“二人策”；其次，田忌有马三等，齐威王也有马三等，双方各用哪一等马去对付对方的哪一等马，其策略个数是有限的，所以又称“有限对策”；最后，每场比赛赌注千金，输方要拿出一千两黄金，而赢方则得到一千两黄金，双方输赢之和恰等于零，所以又称“零和对策”。对于田忌来说，他虽然也有上、中、下三等马，但每等都比齐威王的差，明显地处于劣势的地位。在这样的情况下，如何找到一种最优的策略，使劣势变为优势，就成了田忌能否取胜的关键。赛马策略设田忌的三等马为A、B、C，齐威王的三等马为a、b、c。）很明显，在田忌所有可能采取的六个策略中，有五个都是要输的其中第（1）种输三千两黄金，第（2）（3）（4）（5）种各输一千两黄金只有一个策略，也即是第（６）种策略，才有可能取胜。而孙膑所采取的，正是这个唯一能取胜的策略。我们从他让田忌多下赌注这样有把握的话来看，则可知他对于双方形势的优劣消长，各种策略的利害得失，必然是经过了一番详细的分析和周密的思考的。详细地分析敌我情况，反复地研究各种对策，在所有可能采取的策略中选择一个利多弊少的最优策略，从而使劣势变为优势，最终取得胜利，这正是对策论的基本思想。一个简单的问题 Grundy博弈有一堆数目为n的钱币，由两位选手轮流进行分堆，要求每个选手每次只把其中某一堆分成数目不等的两小堆。例如选手甲把n分成两堆后，轮到乙就可以挑其中一堆来分，如此进行下去，直到有一位选手先无法把钱币分成不相等的两堆时就得认输。状态空间图与或图规则：if (x1,…,xn,Max) and (xi=y+z,y z) then (x1,…,xi-1,y,z,xi+1,…,xn,Min) 上图节点A是Max的目标，而节点B,C则是Min的目标。搜索策略需要考虑的问题是：对Min走后的每一个Max节点,必须证明Max对Min可能的每一个棋局对弈后能获胜，即Max必须应付Min的所有的招法，这是一个“与” 的含义，因此，含有Max的节点可看成与节点。对Max走后的每一个Min节点,只须证明Max有一步走赢就可以，即Max只要考虑走一步棋使Min无法招架就成，因此含有Min的节点可看成“或” 节点。这样对弈过程的搜索图就呈现出“与或图”的形式。 Grundy的与或搜索图极大极小搜索博弈程序的任务就是对博弈树进行搜索找出当前最优的一步行棋。对博弈树进行极大极小搜索，可以达到这一目的。极大极小搜索，是因为博弈双方所要达到的目的相反，一方要寻找的利益恰是一方失去的利益，所以博弈的一方总是希望下一走是儿子节点中取值最大者，而另一方恰恰相反。这便形成了极大极小过程。当然，程序不能也没有必要做到搜索整棵博弈树的所有节点，对于一些已经确定为不佳的走步可以将以它为根节点的子树剪掉。而且，搜索也不必真地进行到分出胜负的棋局，只需要在一定深度范围内对局面进行评价即可。只有搜索空间缩小到一定程度，搜索才可以真正的进行。当搜索进行到一定深度，用局面评价机制来评价棋局，按照极大极小的原则选出最优，向上回溯，给出这一局面的父亲节点的价值评价，然后再继续向上回溯，一直到根节点，最优走步就是这样搜索出来的估价函数极大极小搜索策略是考虑双方对弈若干步之后，从能的走步中选一步相对好棋的着法来走，即在有限的搜索深度范围内进行求解。为此，要定义一个静态估价函数 f,以便对棋局的势态作出优劣估值，这个函数可根据事态优劣特征进行定义，一般规定有利于Max的势态f(p)取正值，有利于Min的势态f(p)取负值，势均力敌，f(p)=0 因此，f(p)=+∞，表示Max赢， f(p)=