第4章 搜索技术 知识-博弈树搜索 2012AI课件 人工智能.pptVIP

第4章 搜索技术 知识-博弈树搜索 2012AI课件 人工智能.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 搜索技术 知识-博弈树搜索 2012AI课件 人工智能.ppt

人 工 智 能 Artificial Intelligence (AI);2.4 博弈问题的搜索技术 2.4.1 博弈问题的表达 2.4.2 极大极小搜索过程 2.4.3 ? - ? 剪枝法;2.4.1 博弈问题的表达 ;博弈的例子: 一字棋 跳棋 中国象棋 围棋 五子棋;双方的智能活动,任何一方都不能单独控制博弈过程,而是由双方轮流实施其控制对策的过程;假设博弈双方为:MAX和MIN 在博弈过程中,规则是双方轮流走步。在博弈树中,相当于博弈双方轮流扩展其所属节点;从MAX方的角度来看: 所有MIN方节点都是与节点 理由: 因为MIN方必定选择最不利于MAX方的方式来扩展节点,只要MIN方节点的子节点中有一个对MAX方不利,则该节点就对MAX方不利,故为“与节点”;从MAX方的角度来看: 所有属于MAX方的节点都是“或节点” 理由: 因为扩展MAX方节点时,MAX方可选择扩展最有利于自己的节点,只要可扩展的子节点中有一个对已有利, 则该节点就对已有利;总之 从MAX方来说,与节点、或节点交替出现;反之,从MIN方的角度来看,情况正好相反;在博弈树中,先行一方的初始状态对应着树的根节点,而任何一方获胜的最终格局为目标状态,对应于树的终叶节点(可解节点或本原问题);例 Grundy博弈:分配物品的问题 如果有一堆数目为N的钱币,由两位选手轮流进行分配,要求每个选手每次把其中某一堆分成数目不等的两小堆,直至有一选手不能将钱币分成不等的两堆为止,则判定这位选手为输家;用数字序列加上一个说明来表示一个状态: (3, 2, 1, 1, MAX) 数字序列:表示不同堆中钱币的个数 说明:表示下一步由谁来分,即取MAX或MIN;现在取N=7的简单情况,并由MIN先分 ;对于比较复杂的博弈问题,只能模拟人的思维“向前看几步”,然后作出决策,选择最有利自己的一步。即只能给出几层走法,然后按照一定的估算办法,决定走一好招;2.4.2 极大极小过程 ;① 对于每一格局(棋局)给出(定义或者倒推)一个静态估价函数值。值越大对MAX越有利,反之越不利;② 对于给定的格局,MAX给出可能的走法,然后MIN对应地给出相应的走法,这样重复若干次,得到一组端节点(必须由MIN走后得到的,由MAX下的棋局)。这一过程相当于节点扩展 注:博弈树深度或层数一定是偶数;③ 对于每一个端节点,计算出它们的静态估价函数,然后自下而上地逐层计算倒推值,直到MAX开始的格局。在MIN下的格局中取估值的最小值,在MAX下的格局中取估值的最大值 ④ 取估值最大的格局作为MAX要走的一招棋;例:向前看一步的两层博弈树 ;定义静态函数e(P)的一般原则:;OPEN:存放待扩展的节点,此时为队列,即以宽度优先的策略扩展节点 CLOSED:存放已扩展的节点,此时为堆栈,即后扩展的节点先计算静态估价函数值 ;1、将初始节点 S 放入 OPEN 表中,开始时搜索树 T 由初始节点 S 构成 2、若 OPEN 表为空,则转5 3、将 OPEN 表中第一个节点 n 移出放入CLOSED 表的前端;4、若 n 可直接判定为赢、输、或平局,则令对应的 e(n)=∞,-∞或 0,并转2;否则扩展 n,产生 n 的后继节点集 { ni },将{ ni }放入搜索树 T 中;此时,若搜索深度d{ ni }小于预先设定的深度 k,则将{ ni }放入OPEN表的末端,转2;否则,ni 达到深度k,计算e ( ni ),并转2;5、若CLOSED表为空,则转8;否则取出CLOSED表中的第一个节点,记为 np;6、若 np 属于MAX层,且对于它的属于MIN层的子节点 nci 的 e ( nci )有值,则: e ( np ) =max { nci };(续) 若 np 属于MIN层,且对于它的属于MAX层的子节点 nci 的 e ( nci )有值,则: e ( np )=min{ nci };7、转5 8、根据 e (S) 的值,标记走步或者结束(-∞,∞或 0);第一阶段为1、2、3、4步,用宽度优先算法生成规定深度 k 的全部博弈树,然后对其所有端节点计算 e(P) 第二阶段为5、6、7、8步,是自下而上逐级求节点的倒推估价值,直至求出初始节点的 e(S) 为止,再由 e(S) 选得相对较好的走法,过程结束;等对手走出相应的棋,再以当前的格局作为初始节点,重复此过程,选择对自己有利的走法;Date;例: 一字棋的极大极小搜索过程 ;① 若格局 P 对任何一方都不能获胜,则 e(P) =(所有空格上都放上MAX的棋子后,MAX的三个棋子

您可能关注的文档

文档评论(0)

yuzongxu123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档