人工智能第四章XXXX.ppt

  1. 1、本文档共93页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
思考:对于一个优秀的博弈者来说,应考虑的不只是对方一步的走法,而是若干步的走法。而且这一过程一般来说是动态进行的,也就是说,在考虑若干步走法以后,下了一步棋,而在对方走棋之后,还要再次考虑若干步走法,决定下一步的走法,而不是一劳永逸,搜索一次就决定了所有的走法。 二、极小极大过程 极小极大过程模拟的就是人的一种思维过程。是考虑双方对弈若干步之后,从可能的走步中选一步相对好棋的着法来走,即在有限的搜索深度范围内进行求解。 下面的讨论规定:顶节点深度d=0,MAX代表程序方,MIN代表对手方,且MAX先走。 静态估值函数e(p):建立在该棋的各种知识和特征上。对在一定深度处的节点所代表的局面 进行评价优劣的估计值. 静态估值函数因游戏而异. 如果对自己(MAX)有利,则取正值,越大,表示对我方越有利。等于正无穷大时,表示我方必胜。 如果对自己不利,则取负值.越小,表示对我方越不利。等于负无穷大时,表示对方必胜。 极小极大过程基本思想: 当轮到我方走棋时,首先按照一定的搜索深度生成出给定深度以内的所有状态,计算所有叶节点的静态估值函数值。然后逆向计算:对于我方要走的节点(MAX节点)取其子节点中的最大值为该节点的值(因为我方总是选择对我方有利的棋);对于对方要走的节点(MIN节点)取其子节点中的最小值为该节点的值(对方总是选择对我方不利的棋)。一直到计算出根节点的值为止。获得根节点取值的那一分枝,即为所选择的最佳走步。 极小极大原则 MAX节点在其MIN子节点的倒推值中选max; MIN节点在其MAX子节点的倒推值中选min 倒推值 在极小极大过程中,第i层节点根据第i+1层节点的值使用极小极大原则而获得的值。 极小极大过程 1.按宽度优先生成0至L层所有节点。 2.使用静态估值函数计算第L层节点的函数值。 3.按极小极大原则计算各层节点的倒推值,直到求出初始节点的倒推值为止。实现该倒推值的走步就是相对好的走步。 2 AO*算法应用举例 设某个问题的状态空间如图所示。    h (n0)=0,h(n1)=2,h(n2)=4,h(n3)=4,h(n4)=1, h(n5)=1,h(n6)=2,h(n7)=h(n8)=0(目标节点)。 假设k-连接符的费用值为k。 图4.3(a) 一次循环后 图4.3(b) 两次循环后 图4.3(c) 三次循环后 0 图4.3(d) 四次循环后 从n0开始,沿指向连接符的指针找到的解图即为搜索的结果。n0给出的修正费用值q(n0)=5就是解图的费用值。 图4.3(e) 搜索得到的解图 Note (1)在第6步扩展节点n时,若不存在后继节点(即陷入死胡同),则可在第11步中对m(即n)赋一个高的q值,这个高的q值会依次传递到s,使得含有节点n的子图具有高的q(s),从而排除了被当作候选局部解图的可能性。 (2)如果一个与/或 图存在解图,如果对于图中所有的节点n都有h(n)≤h*(n),并且启发函数h满足单调限制,则AO*算法必然终止于找出最佳解图。 练习1’: 假定我们有一个产生式系统,基于如下重写规则: R1:n0→n1, n2 R5:n2→n6, n7 R2:n0→n2, n3 R6:n3→n5, n6 R3:n1→n2 R7:n4→n2 R4:n1→n4 R8:n5→n7 (1)用与/或图表示此产生式系统。 (2)若h(n0)=0, h(n1)=2, h(n2)=4,h(n3)=4, h(n4)=3,h(n5)=1,h(n6)=0,h(n7)=0, 为启发函数,k-连接符的费用为k,求n0到{ n6, n7}的最佳解图。(要求:使用AO*算法,画出各次循环图,标明各点费用q(n),画出最后的最佳解图,并指明最佳解图的费用) 练习2’: 一个产生式系统使用下面一组重写规则,这些重写规则把左面的数字转换成右边的数字串。 6→3,3 4→3,1 6→4,2 3→2,1 4→2,2 2→1,1 使用这些规则把6转换成由1组成的数字串。假设k-连接符的费用是k,用数字1标记的节点的h函数值是0,用数字n(n≠1)标记的节点的h函数值是n。请用AO*算法描述解题过程(要求:画出各次循环图,标明各点费用q(n),画出最后的最佳解图,并指明最佳解图的费用)。 4.4 博弈树搜索 博弈

文档评论(0)

191****0059 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5342242001000034
认证主体四川龙斌文化科技有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510100MA6ADW1H0N

1亿VIP精品文档

相关文档