第二章博弈树的搜索.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章博弈树的搜索,博弈树搜索,博弈树搜索算法,博弈树,博弈树算法,树上博弈,博弈树分词,树形博弈,博弈树五子棋6,井字棋博弈树

2.3 博弈树搜索 1.概述 20世纪60年代,研制出的西洋跳棋和国际象棋达到了大师级的水平。 1958约翰?麦卡锡提出博弈树α-β剪枝算法 1997年,IBM公司研制的“深蓝”国际象棋 程序,采用博弈树搜索算法,该程序战胜了国际象棋世界冠军卡斯帕罗夫。 正在与深蓝下棋的卡斯帕罗夫 1.概述 博弈问题特点: 双人对弈,轮流走步。 信息完备,双方所得到的信息是一样的。 零和,即对一方有利的棋,对另一方肯定是不利的,不存在对双方均有利或无利的棋。 1.概述 博弈的特性 两个棋手交替地走棋 ; 比赛的最终结果,是赢、输和平局中的一种; 可用图搜索技术进行,但效率很低; 博弈的过程,是寻找置对手于必败态的过程; 双方都无法干预对方的选择。 下棋的双方是对立的,命名博弈的双方,一方为“正方”,这类节点称为“MAX”节点;另一方为“反方”,这类节点称为“MIN”节点。正方和反方是交替走步的,因此MAX节点和MIN节点会交替出现。 2.Grundy 博弈 Grundy博弈是一个分钱币的游戏。有 一堆数目为N的钱币,由两位选手轮流进行分堆,要求每个选手每次只把其中某一堆分成数目不等的两小堆。例如,选手甲把N分成两堆后,轮到选手乙就可以挑其中一堆来分,如此进行下去,直到有一位选手先无法把钱币再分成不相等的两堆时就得认输。 2.Grundy 博弈 设初始状态为(7,MIN),建立问题的状态空间图,图中所有终结点均表示该选手必输的情况,取胜方的目标是设法使棋局发展为结束在对方走步时的终结点上。 2.Grundy 博弈 2.Grundy 博弈 结点A是MAX的搜索目标,而结点B,C则为MIN的搜索目标。 搜索策略要考虑的问题是: 对MIN走步后的每一个MAX结点,必须证明MAX对MIN可能走的每一个棋局对弈后能获胜,即MAX必须考虑应付MIN的所有招法,这是一个与的含意,因此含有MAX符号的结点可看成与结点。 对MAX走步后的每一个MIN结点,只须证明MAX有一步能走赢就可以,即MAX只要考虑能走出一步棋使MIN无法招架就成,因此含有MIN符号的结点可看成或结点。 对弈过程的搜索图呈现出与或图表示的形式。 实现一种取胜的策略就是搜索一个解图的问题,解图就代表一种完整的博弈策略。 3.极小极大搜索过程 对各个局面进行评估 评估的目的:对后面的状态提前进行考虑,并且以各种状态的评估值为基础作出最好的走棋选择。 评估的方法:用评价函数对棋局进行评估。赢的评估值设为+∞,输的评估值设为-∞,平局的评估值设为0。 评估的标准:由于下棋的双方是对立的,只能选择其中一方为评估的标准方。 MAX节点和MIN节点 命名博弈的双方,一方为“正方”,对每个状态的评估都是对应于该方的输赢的。例如,赢2个,输1个等,都是指正方的。正方每走一步,都在选择使自己赢得更多的节点,因此这类节点称为“MAX”节点; 3.极小极大搜索过程 另一方为“反方”,对每个状态的评估都是对应于对手的输赢的。例如,赢2个,输一个,其实是指自己输2个,赢1个的。反方每走一步,都在选择使对手输得更多的节点,因此这类节点称为“MIN”节点。 3.极小极大搜索过程 由于正方和反方是交替走步的,因此MAX节点和MIN节点会交替出现。 3.极小极大搜索过程 正方(MAX节点)从所有子节点中,选取具有最大评估值的节点。 反方(MIN节点)从其所有子节点中,选取具有最小评估值的节点。 反复进行这种选取,就可以得到双方各个节点的评估值。这种确定棋步的方法,称为极小极大搜索法。 3.极小极大搜索过程 3.极小极大搜索过程 3.极小极大搜索过程 3.极小极大搜索过程 在九宫格棋盘上,两位选手轮流在棋盘上摆各自的 棋子(每次一枚),谁先取得三线的结果就取胜。 设程序方MAX的棋子用(×)表示, MAX先走。 对手MIN的棋子用(o)表示。 例如: 3.极小极大搜索过程 估计函数 f(p)=(所有空格都放上MAX的棋子之后,MAX的三子成线数)-(所有空格都放上MIN的棋子之后,MIN的三子成线的总数) 若P是MAX获胜的格局,则f(p)=+∞ ; 若P是MIN获胜的格局,则f(p)=-∞ 。 3.极小极大搜索过程 3.极小极大搜索过程 3.极小极大搜索过程 3.极小极大搜索过程 3.极小极大搜索过程 设有一个摆放三个子的棋盘残局,如下图所示,〇和╳在结束前有三步棋可以走,而且设走第一步的是╳ 。这时存在着三个空格A,B,C,用博弈树搜索算法判断应该把棋子放到哪一格内。 3.极小极大搜索过程 3.极小极大搜索过程 对于棋盘残局中的╳来说,最好的选择,是将╳放在C的位置上,这时可以导致平局局面。

文档评论(0)

amngta + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档