第4章搜索技术知识-博弈树搜索 2012AI课件人工智能.pptVIP

下载本文档

17
0
约3.13千字
约 57页
2018-05-29 发布于天津
举报
版权申诉

第4章搜索技术知识-博弈树搜索 2012AI课件人工智能.ppt

1、本文档共57页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第4章搜索技术知识-博弈树搜索 2012AI课件人工智能.ppt

人工智能 Artificial Intelligence (AI);2.4 博弈问题的搜索技术 2.4.1 博弈问题的表达 2.4.2 极大极小搜索过程 2.4.3 ? - ? 剪枝法;2.4.1 博弈问题的表达 ;博弈的例子：一字棋跳棋中国象棋围棋五子棋;双方的智能活动，任何一方都不能单独控制博弈过程，而是由双方轮流实施其控制对策的过程;假设博弈双方为：MAX和MIN 在博弈过程中，规则是双方轮流走步。在博弈树中，相当于博弈双方轮流扩展其所属节点;从MAX方的角度来看：所有MIN方节点都是与节点理由：因为MIN方必定选择最不利于MAX方的方式来扩展节点，只要MIN方节点的子节点中有一个对MAX方不利，则该节点就对MAX方不利，故为“与节点”;从MAX方的角度来看：所有属于MAX方的节点都是“或节点” 理由：因为扩展MAX方节点时，MAX方可选择扩展最有利于自己的节点，只要可扩展的子节点中有一个对已有利，则该节点就对已有利;总之从MAX方来说，与节点、或节点交替出现；反之，从MIN方的角度来看，情况正好相反;在博弈树中，先行一方的初始状态对应着树的根节点，而任何一方获胜的最终格局为目标状态，对应于树的终叶节点（可解节点或本原问题）;例 Grundy博弈：分配物品的问题如果有一堆数目为N的钱币，由两位选手轮流进行分配，要求每个选手每次把其中某一堆分成数目不等的两小堆，直至有一选手不能将钱币分成不等的两堆为止，则判定这位选手为输家;用数字序列加上一个说明来表示一个状态： (3, 2, 1, 1, MAX) 数字序列：表示不同堆中钱币的个数说明：表示下一步由谁来分，即取MAX或MIN;现在取N＝7的简单情况，并由MIN先分 ;对于比较复杂的博弈问题，只能模拟人的思维“向前看几步”，然后作出决策，选择最有利自己的一步。即只能给出几层走法，然后按照一定的估算办法，决定走一好招;2.4.2 极大极小过程 ;① 对于每一格局（棋局）给出（定义或者倒推）一个静态估价函数值。值越大对MAX越有利，反之越不利;② 对于给定的格局，MAX给出可能的走法，然后MIN对应地给出相应的走法，这样重复若干次，得到一组端节点（必须由MIN走后得到的，由MAX下的棋局）。这一过程相当于节点扩展注：博弈树深度或层数一定是偶数;③ 对于每一个端节点，计算出它们的静态估价函数，然后自下而上地逐层计算倒推值，直到MAX开始的格局。在MIN下的格局中取估值的最小值，在MAX下的格局中取估值的最大值 ④ 取估值最大的格局作为MAX要走的一招棋;例：向前看一步的两层博弈树 ;定义静态函数e(P)的一般原则：;OPEN：存放待扩展的节点，此时为队列，即以宽度优先的策略扩展节点 CLOSED：存放已扩展的节点，此时为堆栈，即后扩展的节点先计算静态估价函数值 ;1、将初始节点 S 放入 OPEN 表中，开始时搜索树 T 由初始节点 S 构成 2、若 OPEN 表为空，则转5 3、将 OPEN 表中第一个节点 n 移出放入CLOSED 表的前端;4、若 n 可直接判定为赢、输、或平局，则令对应的 e(n)=∞，-∞或 0，并转2；否则扩展 n，产生 n 的后继节点集 { ni }，将{ ni }放入搜索树 T 中;此时，若搜索深度d{ ni }小于预先设定的深度 k，则将{ ni }放入OPEN表的末端，转2；否则，ni 达到深度k，计算e ( ni )，并转2;5、若CLOSED表为空，则转8；否则取出CLOSED表中的第一个节点，记为 np;6、若 np 属于MAX层，且对于它的属于MIN层的子节点 nci 的 e ( nci )有值，则： e ( np ) =max { nci };（续）若 np 属于MIN层，且对于它的属于MAX层的子节点 nci 的 e ( nci )有值，则： e ( np )=min{ nci };7、转5 8、根据 e (S) 的值，标记走步或者结束（-∞，∞或 0）;第一阶段为1、2、3、4步，用宽度优先算法生成规定深度 k 的全部博弈树，然后对其所有端节点计算 e(P) 第二阶段为5、6、7、8步，是自下而上逐级求节点的倒推估价值，直至求出初始节点的 e(S) 为止，再由 e(S) 选得相对较好的走法，过程结束;等对手走出相应的棋，再以当前的格局作为初始节点，重复此过程，选择对自己有利的走法;Date;例：一字棋的极大极小搜索过程 ;① 若格局 P 对任何一方都不能获胜，则 e(P) =（所有空格上都放上MAX的棋子后，MAX的三个棋子

您可能关注的文档

文档评论（0）

yuzongxu123 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第4章搜索技术知识-博弈树搜索 2012AI课件人工智能.pptVIP