chap12 敌对搜索 人工智能课程 上海交大.pptVIP

chap12 敌对搜索 人工智能课程 上海交大.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
chap12 敌对搜索 人工智能课程 上海交大

第1 2章 敌对搜索 12.1 双a g e n t博弈 两个机器人,分别命名为“b l a c k”和“w h i t e”。它们可以向其所在的行或列中的相邻一格交替地移动(比如说, w h i t e先移动),而且轮到其中一个时,它必须移动。假设w h i t e的目标是与b l a c k在同一格,而b l a c k的目标是避免发生这种情况。w h i t e就可建立一棵搜索树,在交替的级别上,b l a c k可能的行动也被考虑进去。 博弈 这个网格例子是双a g e n t、信息完全,零和博奕的一个实例。此处所讨论的是,两个a g e n t(称为博弈者)轮流移动,直到其中任何一方获胜(另一方因此失败),或双方和局。 每个博弈者完全熟悉环境及自己和对方可能的移动方式和影响(尽管每个博弈者都不知道另一方在任何情况下究竟会怎样移动)。 12.2 最小最大化过程 在以下讨论中,命名两个博弈者M A X和M I N。我们的任务是为M A X找最佳的移动。 假设M A X先移动,然后两个博弈者轮流移动。因此,深度为偶数的节点,对应于M A X下一步移动的位置,称为M A X节点;深度为奇数的节点对应于M I N下一步移动的位置,称为M I N节点(博弈树的顶节点深度为0) 。 静态评估函数 采用静态评估函数。此评估函数衡量每一个叶节点位置的“值”。这种衡量基于影响这个值的许多不同特性;例如,在西洋跳棋中,一些有用的特性衡量相关部分优势、中心控制、王的中心控制等等。通常分析博弈树时,对M A X有利的位置,评估函数将赋于正值;对M I N有利的位置赋于负值,接近零的值表示该位置对M A X和M I N都一样。 最大值 假设轮到M A X从搜索树的叶节点中选取,他肯定选择拥有最大值的节点。因此,M I N叶节点的一个M A X节点双亲的倒推值就等于叶节点的静态评估值中的最大值。另一方面, M I N从叶节点中选取时,必然选值最小的节点(即最负的值)。既然如此,M A X叶节点的M I N双亲节点被分配一个倒推值,它等于叶节点静态评估值的最小值。在所有叶节点的父节点被赋于倒推值后,开始倒推另一层,假定M A X将选择有最大倒推值的M I N后继节点,而M I N会选择有最小倒推值的M A X后继节点。 倒推值和静态评估函数 整个过程的有效性基于这样的假设:开始节点的后继的倒推值比直接从静态评估函数中得到的值更可靠。 井字博弈 井字博弈的简单例子阐述了最小最大化方法(在井字博弈中,博弈者在3×3数组中轮流标记,一个标记(X),一个标记(O)。先用标记填满一行、一列或一条对角线者便赢得博弈)。 假设M A X标记(X),M I N标记(O),M A X先开始。在深度为2的范围内进行广度优先搜索,直 到第二级节点全部产生,然后在这些节点代表的位置采用静态评估函数。 位置p的静态评估函数e(p) 感知/计划/动作 现在,按照感知/计划/动作的循环,假设M A X走了这一步而且M I N在(X)的左边做标记(O)(对M I N来说,这不是一个好的走法,它没有用一个好的搜索策略)。在这种布局下,M A X进行深度为2的搜索,产生如图1 2 - 4所示的树。 alpha值 设想这样的情况: A节点及其所有后继都已产生,而B节点还未产生,A节点的倒推值为- 1。这时可知开始节点的倒推值范围大于等于- 1。根据开始节点的其他后继的倒推值,开始节点的最终倒推值可能大于- 1,但决不会小于-1,我们把这个下界称为开始节点的alpha值。 beta值 程序演示 * *

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档