- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机博弈高级搜索算法 徐长明 概要 迭代加深搜索 Alpha-beta的改进搜索算法 威胁空间搜索 证明数搜索 迭代加深搜索 如何设定深度优先搜索的最大深度? 当采用深度优先搜索方式时,因无法知道解的深度,最大搜索深度的设置便成了个难题。 无法准确地预测解的深度; 无法精确控制时间(深度大可能超时,否则过早结束搜索); 深度优先的迭代加深搜索(DFID) DFID (Depth First Iterative Deepening)的执行过程如图所示: DFID的特点 DFID的特点: 以深度优先的方式模拟深度优先,因而可找到路径最短的解; 迭代加深为优化时间控制提供支持; 迭代加深的额外代价并不高; 当分枝因子为R,当前迭代的最大深度为d时,DFID总的代价为: Time(R, d) = ( Rd +2Rd-1+…+ dR+(d+1)R0) = Rd (1+2R-1+…+ dR1-d +(d+1)R-d) Rd(1-1/R)-2 R=2: Time(R, d) = 4 Rd R=3: Time(R, d) = 9/4 Rd R=4: Time(R, d) = 16/9 Rd R=5: Time(R, d) = 25/16 Rd 此外,浅层迭代对深层迭代有重要的启发作用; 再谈alpha-beta 着法排序的优化作用 着法排序的优化作用(续) 窗口(alpha, beta)的涵义 alpha: 受Min方制约,Max方已知的最佳的叶子节点对应的分值; 在一次搜索过程中,alpha的值不会减小 beta:受Max方制约,Min方已知的最佳的叶子节点对应的分值; 在一次搜索过程中,beta的值不会增大 (alpha, beta)的变化趋势是收敛; 窗口的本质是对返回值范围的约束或猜测;窗口的变化乃是对约束的或猜测的不断修正。 (alpha, beta) 窗口 (alpha, beta) 窗口 (alpha, beta) 窗口 alpha-beta算法的执行过程 对alpha-beta算法的执行过程加以简要概括: 向下(父向子)传递一个窗口; 向上(子向父)返回一个值; 用该返回值进一步修正父节点的窗口。 alpha-beta算法 具体地 父节点以值传递的方式向儿子节点传递窗口 纯粹的极大极小算法向下传递(alpha, beta); 负极大值形式的算法向下传递(-beta, -alpha); 儿子节点仅返回给父节点一个估值(设为val) (纯粹的极大极小)若父节点是极大值节点,则val可能会更改父节点窗口的下界,但绝不更改上界; (纯粹的极大极小)若父节点是极小值节点,则val可能会更改父节点的上界,但绝不更改下界。 思考:在负极大值形式的alpha-beta搜索中,返回值会更改父节点的哪个边界? 窗口变化的影响 初始窗口的设置 对初始窗口大小的权衡 初始窗口越小,剪枝的效率就越高; 初始窗口越小,搜索失败(Fail),即返回值位于窗口(a, b)之外的可能性就越大。 初始窗口的两种选择 (-?,+? ) ——最安全,也最没效率 (a, b)且a -?, b +? ——可能有风险,但可能比较有效率 Fail-soft vs. Fail-hard Fail-hard Fail-soft vs. Fail-hard Fail-hard Fail-soft vs. Fail-hard Fail-soft Fail-soft vs. Fail-hard Fail-soft 返回值若未落在窗口内,搜索便告失败; 但在执行重新搜索时,返回值指示了新的初始窗口不必覆盖的范围。 Fail-hard 只要返回值不严格大于alpha且严格小于beta,搜索便告失败。 但从此时的返回值只能得知搜索失败的结论,无法根据返回值猜测出更准确的窗口。 Fail-low 和 Fail-high 执行alpha-beta搜索,当预设了初始窗口为(a, b)时 Fail-low是指返回值比下界alpha还小; Fail-high是指返回值比上界beta还大。 Fail-low, Fail-high, pruning Fail-high或fail-low与pruning( 剪枝 )的区别: 前者是指返回值落在搜索前预设(猜测)的窗口(a, b)之外。Fail-high或Fail-low说明预先猜测的窗口范围有失准确,凭借该窗口寻找根节点的最佳着法的努力失败了。 剪枝是指某些着法或分枝对最终的搜索结果没有影响,因而可以不搜索。尽管剪枝也表现为返回值位于窗口(a, b)之外,但它是在充分相信给定约束(即窗口)的前提下,从而免于搜索某些无用节点的。 Fail-low, Fail-high, pruning Fail-
您可能关注的文档
- [毕业设计]办公楼土建工程量计算及2008工程量清单计价编制实例(附图纸)_secret.doc
- 《土地管理学总论》(第2版)课件-20110503.pdf
- 2015年度寿光市黄河木业有限公司销售收入与资产数据报告.pdf
- 2015年四川师范大大学考研真题研究生入学考题—828物理教学论与大学物理.pdf
- 2016出租汽车驾驶员从业资格考试全国公共科目题库(最新版).pdf
- 2016届高考数学百例经典压轴题及答案解析.pdf
- 2017考研针灸速记病证篇.pdf
- flash cs5 练习:制作心理测试程序.pdf
- 安徽轨道交通工程地铁车站安全生产突发事故应急救援总体预案.doc
- 北师大版生物七年级下册11章2节尿的形成与排出二课时精品课件.pdf
文档评论(0)