- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章博弈树的搜索1
对于棋盘残局中的╳来说,最好的选择,是将╳放在C的位置上,这时可以导致平局局面。 3.极小极大搜索过程 ?-?剪支法的引入 在极小极大法中,必须求出所有终端节点的评估值,当预先考虑的棋步比较多时,计算量会大大增加。为了提高搜索的效率,引入了通过对评估值的上下限进行估计,从而减少需进行评估的节点范围的?-?剪支法。 4. ?-?搜索过程 作为正方出现的MAX节点,假设它的MIN子节点有N个,那么当它的第一个MIN子节点的评估值为?时,则对于其它的子节点,如果有高过?的,就取那最高的值作为该MAX节点的评估值;如果没有,则该MAX节点的评估值为?。 总之,该MAX节点的评估值不会低于?,这个?就称为该MAX节点的评估下限值。 4. ?-?搜索过程 MAX节点的评估下限值? MIN节点的评估上限值? 作为反方出现的MIN节点,假设它的MAX子节点有N个,那么当它的第一个MAX子节点的评估值为?时,则对于其它子节点,如果有低于?的,就取那个低于?的值作为该MIN节点的评估值;如果没有,则该MIN节点的评估值取?。 总之,该MIN节点的评估值不会高过?,这个?就称为该MIN节点的评估上限值。 4. ?-?搜索过程 ?剪支法 MAX节点 ?? MIN节点 ?=? ??? ??? ?剪支 A B C D 4. ?-?搜索过程 设MAX节点的下限为?,则其所有的MIN子节点中,其评估值的?上限小于等于?的节点,其以下部分的搜索都可以停止了,即对这部分节点进行了?剪支。 设MIN节点的上限为?,则其所有的MAX子节点中,其评估值的?下限大于等于?的节点,其以下部分的搜索都可以停止了,即对这部分节点进行了?剪支。 MAX节点 ?? MIN节点 ?=? ??? ??? ?剪支 A B C D 4. ?-?搜索过程 ?剪支法 A B C D E F G H I J K L N O M 4. ?-?搜索过程 MAX节点 MAX节点 MIN节点 终端节点 3 5 6 5 2 1 6 4 MAX节点 (5,?) 3 5 6 5 2 1 6 4 (6,?) (2,?) (-?,5) (-?,2) (5,?) MIN节点 终端节点 ?剪支 ?剪支 A B C D E F G H I J K L N O M MAX节点 4. ?-?搜索过程 一字棋第一阶段?-?剪支方法 4. ?-?搜索过程 4. ?-?搜索过程 极大节点的下界为?。 极小节点的上界为?。 剪支的条件: 后辈节点的?值≤祖先节点的?值时, ?剪支 后辈节点的? 值≥祖先节点的?值时, ?剪支 简记为: 极小≤极大, ?剪支 极大≥极小, ?剪支 4. ?-?搜索过程 8 6 -3 1 4 5 3 -3 5 0 3 -3 0 2 2 -3 0 -2 3 0 9 -3 0 0 -3 0 3 3 0 5 4 1 1 -3 1 6 6 1 a b c d e f g h i j k m n MAX MIN MAX MIN 改进方法 使用?-?剪支技术,当不满足剪支条件(即???)时或?值比?值大不了多少或极相近时,这时也可以进行剪支,以便有条件把搜索集中到会带来更大效果的其他路径上,这就是中止对效益不大的一些子树的搜索,以提高搜索效率。 4. ?-?搜索过程 不严格限制搜索的深度。当到达深度限制时,如出现博弈格局有可能发生较大变化时,则应多搜索几层,使格局进入较稳定状态后再中止,这样可使倒推值计算的结果比较合理,避免考虑不充分产生的影响,这是等候状态平稳后中止搜索的方法。 4. ?-?搜索过程 当算法给出所选的走步后,不要马上停止搜索,而是在原先估计可能的路径上再往前搜索几步,再次检验会不会出现意外,这是一种增添辅助搜索的方法。 4. ?-?搜索过程 对某些博弈的开局阶段和残局阶段,往往总结了一些固定的对弈模式,因此可以利用这些知识编好走步表,以便在开局和结局时使用查表法。只是在进入中盘阶段后,再调用其他有效的搜索算法,来选择最优的走步。 4. ?-?搜索过程 * * * * * * * * * * * * * ??● ○ ??● ○ ??● ○ ?? ● ○ ● ?? ○ ● ?? ○ ● ?? ○ ● ?? ○ 2.3 博弈树搜索 20世纪60年代,研制出的西洋跳棋和国际象棋的博弈程序达到了大师级的水平。 1958约翰?麦卡锡提出博弈树搜索算法 1997年,IBM公司研制的“深蓝”国际象棋 程序
文档评论(0)