第12章敌对搜索讲解.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第12章 敌对搜索 ;双agent博弈 ; 以右图中的网格为例,两个机器人,分别命名为“black”和“white”。它们可以向其所在的行或列中的相邻一格交替地移动(比如说, white先移动),而且轮到其中一个时,它必须移动。;双agent博弈 ;最小最大化过程 ;最小最大化过程 ; 命名两个博弈者MAX和MIN。我们的任务是为MAX找最佳的移动。假设MAX先移动,然后两个博弈者轮流移动。 因此,深度为偶数的节点,对应于MAX下一步移动的位置,称为MAX节点;深度为奇数的节点对应于MIN下一步移动的位置,称为MIN节点(博弈树的顶节点深度为0)。k层包括深度为2k和2k+1的节点。通常用层数给出博弈树的搜索程度,它可以表示出向前预测的MAX和MIN交替运动的回合数。 通常分析博弈树时,对MAX有利的位置,评估函数将赋予正值;对MIN有利的位置赋予负值,接近零的值表示该位置对MAX和MIN都一样。 ;最小最大化过程 ;最小最大化过程 ;最小最大化过程 ;最小最大化过程 ;最小最大化过程 ; 现在,按照感知/计划/动作的循环,假设MAX走了这一步而且MIN在(X)的左边做标记(0) (对MIN来说,这不是一个好的走法,它没有用一个好的搜索策略)。在这种布局下,MAX进行深度为2的搜索,产生如图所示的树。 ;最小最大化过程 ;α-β过程 ;α-β过程 ;α-β过程 ;α-β过程 ;α-β过程 ;α-β过程 ;α-β过程 ;其他重要问题 ;概率博弈 ;学习评估函数 ; 198种输入(代表西洋双陆棋格局)被全部连接到隐藏单元,隐藏单元全部连接到输出单元。隐藏单元与输出单元都是Sigmoid。输出单元根据输入格局产生的结果的可能值产生4个估计值p1、p2、p3和p4。 布局位置的全局值由一个估算的性能指标给出: v= p1 +2p2 –p3 -2p4。在用网络操作西洋双陆棋时,投掷骰子,现有布局的任何可能的移动产生新的布局,并由网络来评估骰子的变化。选取含有最好v值的布局,进行产生这种格局的移动(假如是白棋移动,最大的v值最好;假如是黑棋移动,最小的v值最好)。

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档