第10章计划、动作和学习精品.ppt

* * 第10章 计划、动作和学习 第二部分 状态空间搜索 我们已经探讨了在图中查找路径的几种技术,现在来研究这些方法如何被agent用于现实问题中。 感知/计划/动作循环 基于搜索的规划方法的功效依赖于几个很强的假设。由于以下原因,这些假设常常得不到满足: 1)知觉过程不可能总是提供环境状态的必需信息(由于噪声或者对重要的特性不敏感)。当两种不同的环境状态引起相同的传感器输入时,我们称这种情况为感知混淆(perceptual aliasing)。 2)动作并不总有其模型效果(由于模型不够精确,或者受动器系统在执行动作时偶尔会产生错误)。 3)可能在环境中有其他的物理过程或其他的agent(例如,在游戏中有对手)。这些过程可能会改变环境以致于干扰agent的动作。 4)外部作用的存在会引起其他的问题:在构造一个计划期间,环境可能变得与原来的计划不相干。这种困难使得花费太多的时间为一个agent进行计划而变得毫无意义。 5)agent可能在完成一个到达目标状态的搜索之前被要求动作。 6)即使agent有充分的计算时间,但是计算要求的空间资源不允许搜索进行到目标状态。 感知/计划/动作循环 有两种主要方法可以用来解决这些困难,同时又能保留基于搜索的计划的主要特征。一种是用概率方法来形式化知觉

文档评论(0)

1亿VIP精品文档

相关文档