第10章计划、动作和学习精品.ppt

下载文档 降价啦

0
0
约3.06千字
约 24页
2017-06-09 发布于湖北
举报
保障服务

第10章计划、动作和学习精品.ppt

* * 第10章计划、动作和学习第二部分状态空间搜索我们已经探讨了在图中查找路径的几种技术，现在来研究这些方法如何被agent用于现实问题中。感知／计划／动作循环基于搜索的规划方法的功效依赖于几个很强的假设。由于以下原因，这些假设常常得不到满足： 1)知觉过程不可能总是提供环境状态的必需信息(由于噪声或者对重要的特性不敏感)。当两种不同的环境状态引起相同的传感器输入时，我们称这种情况为感知混淆(perceptual aliasing)。 2)动作并不总有其模型效果(由于模型不够精确，或者受动器系统在执行动作时偶尔会产生错误)。 3)可能在环境中有其他的物理过程或其他的agent(例如，在游戏中有对手)。这些过程可能会改变环境以致于干扰agent的动作。 4)外部作用的存在会引起其他的问题：在构造一个计划期间，环境可能变得与原来的计划不相干。这种困难使得花费太多的时间为一个agent进行计划而变得毫无意义。 5)agent可能在完成一个到达目标状态的搜索之前被要求动作。 6)即使agent有充分的计算时间，但是计算要求的空间资源不允许搜索进行到目标状态。感知／计划／动作循环有两种主要方法可以用来解决这些困难，同时又能保留基于搜索的计划的主要特征。一种是用概率方法来形式化知觉

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第10章计划、动作和学习精品.ppt