人工智能第四章2014.ppt

  1. 1、本文档共91页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人工智能第四章2014

二、极小极大过程 极小极大过程模拟的就是人的一种思维过程。是考虑双方对弈若干步之后,从可能的走步中选一步相对好棋的着法来走,即在有限的搜索深度范围内进行求解。 下面的讨论规定:顶节点深度d=0,MAX代表程序方,MIN代表对手方,且MAX先走。 静态估值函数e(p):建立在该棋的各种知识和特征上。对在一定深度处的节点所代表的局面 进行评价优劣的估计值. 静态估值函数因游戏而异. 如果对自己(MAX)有利,则取正值,越大,表示对我方越有利。等于正无穷大时,表示我方必胜。 如果对自己不利,则取负值.越小,表示对我方越不利。等于负无穷大时,表示对方必胜。 图4.3(a) 一次循环后 图4.3(b) 两次循环后 图4.3(c) 三次循环后 0 图4.3(d) 四次循环后 从n0开始,沿指向连接符的指针找到的解图即为搜索的结果。n0给出的修正费用值q(n0)=5就是解图的费用值。 图4.3(e) 搜索得到的解图 Note (1)在第6步扩展节点n时,若不存在后继节点(即陷入死胡同),则可在第11步中对m(即n)赋一个高的q值,这个高的q值会依次传递到s,使得含有节点n的子图具有高的q(s),从而排除了被当作候选局部解图的可能性。 (2)如果一个与/或 图存在解图,如果对于图中所有的节点n都有h(n)≤h*(n),并且启发函数h满足单调限制,则AO*算法必然终止于找出最佳解图。 练习1’: 假定我们有一个产生式系统,基于如下重写规则: R1:n0→n1, n2 R5:n2→n6, n7 R2:n0→n2, n3 R6:n3→n5, n6 R3:n1→n2 R7:n4→n2 R4:n1→n4 R8:n5→n7 (1)用与/或图表示此产生式系统。 (2)若h(n0)=0, h(n1)=2, h(n2)=4,h(n3)=4, h(n4)=3,h(n5)=1,h(n6)=0,h(n7)=0, 为启发函数,k-连接符的费用为k,求n0到{ n6, n7}的最佳解图。(要求:使用AO*算法,画出各次循环图,标明各点费用q(n),画出最后的最佳解图,并指明最佳解图的费用) 练习2’: 一个产生式系统使用下面一组重写规则,这些重写规则把左面的数字转换成右边的数字串。 6→3,3 4→3,1 6→4,2 3→2,1 4→2,2 2→1,1 使用这些规则把6转换成由1组成的数字串。假设k-连接符的费用是k,用数字1标记的节点的h函数值是0,用数字n(n≠1)标记的节点的h函数值是n。请用AO*算法描述解题过程(要求:画出各次循环图,标明各点费用q(n),画出最后的最佳解图,并指明最佳解图的费用)。 4.4 博弈树搜索 博弈 具有竞争或对抗性质的行为称为博弈行为。 比如日常生活中的下棋,打牌等。 在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。 博弈论 Game Theory 博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。 博弈论亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学,经济学,国际关系,计算机科学, 政治学,军事战略和其他很多学科都有广泛的应用。 博弈论历史 博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将双 人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。 1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档