第五章搜索策略概要.ppt

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章搜索策略概要

5 博弈树的启发式搜索 下棋、打牌、战争等一类竞争性智能活动称为博弈 (1)二人零和、全信息、非偶然博弈 对垒的A,B双方轮流采取行动,博弈的结果只有三种情况:A方胜,B方胜,双方战成平局 在对垒过程中,任何一方都了解当前的格局及过去的历史 双方都是很理智地决定自己的行动,不存在“碰运气”偶然因素 (2)描述博弈过程的与/或树为博弈树 博弈的初始格局是初始节点 在博弈树中,“或”节点和“与”节点是逐层交替出现的,自己一方扩展的节点之间是“或”关系,对方扩展的节点之间是“与”关系,双方轮流地扩展节点。 所有能使自己一方获胜的终局都是本原问题,相应的节点是可解节点;所有使对方获胜的终局都是不可解节点 (3)极大极小分析法 设博弈双方中一方为A,另一方为B,极大极小分析法是为其中一方(A)寻找一个最优行动方案的方法 考虑每一方案实施后对方可能采取的所有行动,计算可能的得分 定义一个估价函数,用来估计当前博弈树端节点的得分,得分称为静态估值 由端节点的估值计算父节点得分—倒推值 “或”节点:选其子节点中最大的得分作为父节点的得分,立足最好 “与”节点:选其子节点中最小的得分作为父节点的得分,立足最坏 如果一个行动方案能获得较大的倒推值,则它是当前最好的行动方案 例 倒推值的计算 3 2 2 1 -1 -1 2 4 2 -2 6 -2 4 3 3 4 0 0 -5 6 -5 1 8 1 6 3 3 2 6 2 2 3 0 3 2 0 2 5 8 例 一棋类游戏,九个空格,由A,B两人对弈,每次放一个棋子,谁先使自己的棋构成三个子成一线,谁赢。 设 A的棋子为a,B的棋子为b,每次扩展二层 棋局为P,估价函数为e(P) 关于e(P)有 若p是A胜e(P)=+? 若P是B胜e(P)=-? 若P胜负未定e(P)=e(+P)-e(-P) e(+P):棋局P上有可能使a成为三子成一线的数目 e(-P):棋局P上有可能使b成为三子成一线的数目 具有对称性的两个棋局称一个棋局 b a b a b a a b A先走,有: a b a b a b a b b a b a a a a a b a b b a b a a b a b S0 S1 S2 S3 S4 S5 6-5=1 5-5=0 6-5=1 5-5=0 4-5=-1 1 2 -1 0 -1 0 -2 A走S3,B走S4 例如: -1 -2 1 1 6 剪枝技术 (1)剪枝原因 因为博弈树生成的工作量大,鉴于博弈树具有“与”节点,“或”节点逐层交替出现的特点,若能边生成节点边计算估值及倒推值,则可删除一些不必要的节点,减少搜索计算的工作量。 例 从s3和s4得s1倒推值为3 从s5知s2的倒推值最大为2 因为s0是或节点,则s0的倒推值为3 虽然s6没估值,但不影响对上层节点的倒推计算,则该分支可从博弈树中剪去。 3 5 2 3 ? 2 3 S0 S1 S2 S3 S4 S5 S6 对于“与”节点来说,取当前子节点中的最小倒推值作为它倒推值的上界,称此值为?值。 对于“或”节点来说,取当前子节点中的最大倒推值作为它倒推值的下界,称此值为?值。 (2) ?-?剪枝技术的一般规律 任何“或”节点x的?值,如果不能降低其父节点的?值,则对节点x以下的分支可停止搜索,并使x的倒推值为?,这种剪枝称为?剪枝 任何“与”节点x的?值,如果不能升高其父节点的?值,则对节点x以下的分支可停止搜索,并使x的倒推值为?,这种剪枝称为?剪枝 对于一个“或”节点,如果估值最高的节点最先生成,或者对于一个“与”节点,估值最低的子节点最先生成,则被剪的节点数最多,搜索的效率最高,称为最优?-?剪枝法。 由节点K、L、M的估值推出节点F的倒推值为2,即F的β值为2,由此可推出节点C的倒推值≥2。即C的倒推值的下界为2,故C的?值为2。由节点P的估值推知节点G的倒推值≤1,无论G的其它子节点的估值是多少,G的倒推值都不可能比1大。因此,1是G的倒推值的上界,所以G的β值为1。 又已知C的倒推值≥2,G的其它子节点又不可能使C的倒推值增大,因此对G的其它分枝不必再搜索,相当于把这些分枝剪去。 同理可知节点H的β值为-2,H的除Q外的其它分枝也被剪去。 由于F,G,H的倒推值可推出节点C的倒推值为2,再由C可推出节点A的倒推值≤2,即A的β值为2。 由节点R,S推出节点I的倒推值为5,可推出D的倒推值≥5。此时D的其它子节点的倒推值无论是多少都不能使D及A的倒推值减小或增大,所以D的其它分枝被剪去,并可确定A的倒推值为2。以此类推,最终推出S0的倒推值为2。 (2)搜索过程

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档