3第三章节搜索策略.pptVIP

下载本文档

13
0
约3.53万字
约 245页
2018-10-18 发布于湖北
举报
版权申诉

3第三章节搜索策略.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

3第三章节搜索策略

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * g(n)值-取至今已发现的自s到n的实际路经代价 * * 把双人博弈过程用与或树的形式表示出来，这样就可以得到一棵AND-OR树，这种AND-OR树称为博弈树。博弈是双方轮流实施控制对策的过程，所以博弈树是一种特殊的与或树。在博弈树中，那些下一步该MAX走的节点称为MAX节点，而下一步该MIN走的节点称为MIN节点。如此新生成的节点由敌我双方交替出现。 * * 下图所示是向前看两步，共四层的博弈树，用□表示MAX，用○表示MIN，端节点上的数字表示它对应的估价函数的值。在MIN处用圆弧连接，用0表示其子节点取估值最小的格局。图中节点处的数字，在端节点是估价函数的值，称它为静态值，在MIN处取最小值，在MAX处取最大值，最后MAX选择箭头方向的走步。 * * 博弈树特点： (1)博弈的初始状态是初始节点； (2)博弈树的“与”节点和“或”节点是逐层交替出现的； (3)整个博弈过程始终站在某一方的立场上，所以能使自己一方获胜的终局都是本原问题，相应的节点也是可解节点，所有使对方获胜的节点都是不可解节点。 * * 在人工智能中可以采用搜索方法来求解博弈问题，下面就来讨论博弈中两种最基本的搜索方法。 * * 极大极小过程极大极小过程是考虑双方对弈若干步之后，从可能的走法中选一步相对好的走法来走，即在有限的搜索深度范围内进行求解。为此，需要定义一个静态估价函数f,以便对棋局的态势做出评估。 * * 这个函数可以根据棋局的态势特征进行定义。假定对弈双方分别为MAX和MIN，规定：有利于MAX方的态势：f(p)取正值有利于MIN方的态势：f(p)取负值态势均衡的时候：f(p)取零其中p代表棋局。 * * MINMAX基本思想： (1)当轮到MIN走步的节点时（取与时），MAX应考虑最坏的情况（即f(p)取极小值）。 (2)当轮到MAX走步的节点时（取或时），MAX应考虑最好的情况（即f(p)取极大值）。 (3)评价往回倒推时，对应于两位棋手的对抗策略，交替使用（1）和（2）两种方法传递倒推值。所以这种方法称为极大极小过程。 * * 下图所示是向前看两步，共四层的博弈树，用□表示MAX，用○表示MIN，端节点上的数字表示它对应的估价函数的值。在MIN处用圆弧连接，用0表示其子节点取估值最小的格局。图中节点处的数字，在端节点是估价函数的值，称它为静态值，在MIN处取最小值，在MAX处取最大值，最后MAX选择箭头方向的走步。 * * 用一字棋说明极大极小过程，设只进行两层，即每方只走一步。一字棋游戏规则如下：设有一个三行三列的棋盘，如图所示，两个棋手轮流走步，每个棋手走步时往空格上摆一个自己的棋子，谁先使自己的棋子成三子一线为赢。设MAX方的棋子用×标记，MIN方的棋子用○标记，并规定MAX方先走步。 * * 为了不致于生成太大的博弈树，假设每次仅扩展两层。估价函数定义如下：设棋局为P，估价函数为e(P)。 (1)若格局p对任何一方都不是获胜的(胜负未定)，则 e(p) = (棋局P上有可能使MAX成为三子成一线的状态的数目) –（棋局P上有可能使MIN成为三子成一线的状态的数目）= e(+p)-e(-p) (2)若p是MAX必胜的棋局，则 e(p) = +∞ (3)若p是MIN必胜的棋局，则 e(p) = -∞ * * 若p为下图所示，且 e(P)=e(+P)-e(-P)=5-4=1 * * 假设由MAX先走棋，且我们站在MAX立场上。下图给出了MAX的第一着走棋生成的博弈树。图中节点旁的数字分别表示相应节点的静态估值或倒推值。由图可以看出，对于MAX来说最好的一着棋是S3，因为S3比S1和S2有较大的估值。 * * α-β过程上面讨论的极大极小过程先生成一棵博弈搜索树，而且会生成规定深度内的所有节点，然后再进行估值的倒推计算，这样使得生成博弈树和估计值的倒推计算两个过程完全分离，因此搜索效率较低。如果能边生成博弈树，边进行估值的计算，则可能不必生成规定深度内的所有节点，以减少搜索的次数，这就是下面要讨论的α-β过程。 * * 考虑：如果边生成博弈树，边进行估值的计算会带来什么好处。 * * α-β过程就是把生成后继和倒推值估计结合起来，及时剪掉一些无用分支，以此来提高算法的效率。下面仍然用一字棋进行说明。现将原图左边所示的一部分重画在图中。