- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 超越经典搜索.ppt
小结 联机搜索问题 联机搜索智能体 联机局部搜索 避免局部极小值 联机搜索的学习 课堂练习 (1)设计一个用于解决八数码问题的爬山法搜索算法,给出算法伪代码。(2)对于下图所示的八数码问题的初始状态,请分析您的算法是否能够到达目标状态? 模拟退火搜索SIMULATED-ANNEALING函数中的参数schedule,是从时间到“温度”的一个映射。请为schedule给出一个合理的例子。 作业 对下图所示的环境进行探索。假设对于任意状态s,h(s)已知,即h(s) =|GX-sX|+GY-sY|,其中G为目标状态。 请问使用最简单爬山法算法进行联机搜索,智能体会卡在局部最小值吗? 在这种情况下,LRTA*是怎样避免局部极小值的?请简要解释。 * 回顾回溯搜索 * 是非经过不知难 * 回顾回溯搜索 * unexplored[s‘] ? Action(s’), unexplored[s‘] 记录状态s’下能采取的全部行动。 在双向搜索空间,可以走回头路。 * 回顾回溯搜索 * 实现这个方案的智能体被称为实时学习A*(即LRTA*)。 * * 回顾回溯搜索 第4章 超越经典搜索 中国科大 计算机学院 第Ⅱ部分 问题求解 本章内容 4.1 局部搜索算法和最优化问题 4.2 连续空间中的局部搜索 4.3 使用不确定动作的搜索 4.4 使用部分可观察信息的搜索 4.5 联机搜索Agent和未知环境 本节内容 联机搜索问题 联机搜索智能体 联机局部搜索 联机搜索的学习 智能体和环境 智能体可以被视为通过传感器感知所处环境并通过执行器对该环境产生作用的东西。 Agent 传感器 ? 执行器 环境 感知 行动 真空吸尘器世界 只有两个地点的真空吸尘器世界 Percept sequence Action [A, Clean] [A, Dirty] [B, Clean] [B, Dirty] [A, Clean], [A, Clean] [A, Clean], [A, Dirty] …… [A, Clean], [A, Clean], [A, Clean] [A, Clean], [A, Clean], [A, Dirty] Right Suck Left Suck Right Suck …… Right Suck 联机搜索问题 脱机搜索:在涉足实际问题之前先计算出完整的解决方案,然后不需要感知就能够执行解决方案。 联机搜索智能体:通过计算和行动的交叉来完成。 智能体首先采取一个行动; 然后观察问题的环境并且计算下一个行动。 脱机搜索:通常需要考虑所有可能发生的情况而制定可能是指数级大小的偶发事件处理计划。 联机搜索:只需要考虑实际发生的情况。 联机搜索问题 应用领域: 动态或半动态的问题领域; 对于停留不动或者计算时间太长都会有惩罚的领域; 甚至是一个完全随机的领域。 探索问题必须用联机搜索。 例如:放在新建大楼里的机器人,要求它探索大楼,绘制出一张从A到B的地图。 联机搜索只能通过智能体执行行动解决,而不是纯粹的计算过程。 联机搜索问题 假设智能体仅知道如下信息: ACTIONS( s ),返回状态s下可能行动的列表; 单步耗散函数c( s, a, s? ),但必须在智能体知道行动的结果为s?时才能用; GOAL-TEST( s )。 注意:智能体不能访问一个状态的后继,除非它实际尝试了该状态下的所有行动。 联机搜索问题 迷宫问题:目标是从状态S出发到达状态G。但智能体对环境一无所知。 智能体不知道从状态(1,1)采取Up行动能到达状态(1,2); 或者,当已经到达状态(1,2)时,不知道行动Down能回到状态(1,1)。 在某些应用中,这种“无知程度”可以降低。比如,机器人探测器也许知道其移动的行动是如何运转的,只是对障碍物一无所知。 联机搜索问题 假设: 智能体总能够认出它以前已经达到过的状态,并且它的动作是确定性的。 智能体将使用一个能够估计从当前状态到目标状态的距离的可采纳启发函数h(s)。 例如,对于迷宫问题,智能体知道目标的位置并且可以使用曼哈顿距离启发式。 联机搜索问题 理想的竞争率为1。 联机搜索问题 具有死路的状态空间。 死路是机器人探索中的实际困难——楼梯、斜坡、悬崖和各种各样的自然地形都可能会是死路。 联机搜索问题 假设:状态空间是可安全探索的。 从每个可到达的状态出发都有某些目标状态是可到达的。 即使在可安全探索的环境里,如果有无界耗散的路径就一定会有无界的竞争率。 不管智能体选择那条路,对手都用细长的墙封锁路径,所以智能体所走的路径比最佳路径可能要长得多。 本章内容 联机搜索问题 联机
文档评论(0)