应对规划中的概率规划算法研讨.pdfVIP

  • 11
  • 0
  • 约6.81千字
  • 约 5页
  • 2018-01-12 发布于广东
  • 举报
第八届中国青年运筹信息管理学者大会论文集 桂林,2006年8月18—22日,第592—596页 应对规划中的概率规划算法研究 李哓峰谷文祥 东北师范大学计算机学院,吉林长春,130117 摘要概率规划器是对经典图规划器在处理不确定性问题的一个有效扩展,但在应用概率规划 器算法于应对规划中时.概率舰划器操作的相应输出概率由人为定义的特性将大大降低其实用 性。基于概率规划器和应对规划的思想,本文提出一种有效可行的通过历史数据的统计得出概 率规划器的操作对应的概率算法。 关键词智能规划,图规划,概率规划,应对规划 1引言 应对规划旨在研究在识别出对方的规划后,提出相应的对策(自身的规划),而达到 自身的目标。在考虑对方规划系统对于我们的规划系统无论是友好的还是敌意的,处理的 基本方法应该只限于这种情况,即根据对方的动作。做出相应的对策。在复杂的现实世界 L}J,识别对方的规划是可能出现多种情况和许多不确定的因素,而经典图规划方法局限于 确定性的世界状态中,这将使得仪基于图规划的应对方法在处理实际的问题时将出现问 题。而在考虑多种情况时,多种情况将会是有所侧重的,不能对所肯可能仅给出同一的应 对方法,而基于经舆图规划的方法,将不能区分不同的规划,或对所有的规划以同样的方 法处理,不存在主次关系,这将有失对现实情况的有效反映。 在应对规划过程中处理问题时仅使用经典规划解决问题的方法,将很难避免遇到上面 器[3](Probabilisticplanning),引入了概率知识用于处理图规划框架下的问题,也即 概率规划器,可以对现实世界的不确定性问题提供很好的反应。从而在府对规划过程中考 虑引入概率规划器的方法是不可或缺的,而概率规划器nq概率规划值的取得是依赖了:人工 的定义这一弱点也使得在处理现寅的不确定性问题时很不方便,而臆断的概率值的直接影 响是使得无法确定应对规划应采取哪种应对方法。本文提出通过分析经典图规划方法得到 的规划解的基础上,计算概率J;!Il划器的概率值的方法,通过这种方法可以使概率规划更加 符合应对规划的要求,从而又有效的结合了经典图规划和概率规划器的优点,进而使得应 对规划中可以处理不确定性的问题。 2背景简述 2.1经典图规划算法 规划问题一般定义为:在某些初始条件下,求得一个动作序列(串行、并行或串并行 混合),依次执行此动作序列可以完成某一特定的具体任务,最终达到一个特定目标。在 鹿对规划中的概率规划算法研究 Blum和Furst提出了经典图规划的理论在规划领域得到了认可,获得了成功。 经典的图规划是基于STRIPS[4]域的规划器。这些域包含描述世界开始状态的初始条 件域(initial 世界应满足的条件的目标域(goals)。规划器最终输出的是一组动作叙列,通过这组动作 的执行完成世界从初始状态到达目标状态。 Graphplan的执行依赖于规划图的生成,规划图是一个有向分层图结构,它是由命题 层和动作层交替面组成的,其中命题层的第一层是由初始条件所组成,而动作层的第一层 是由操作作用于命题层而生成的动作组成,这个过程称为实例化,而操作实例化动作的结 果组成下一层的命题层,如此交互的生成直到到达目标域。通过规划图的生成有效的完成 了STRIPS域中的初始条件域、操作域、目标域的结合,从而可以进入有效规划的提取阶 段。 2.2概率规划器 初始条件确定、目标确定、而是封闭的状态空间等,这些限定使得经典规划在处理现实中 的执行效率的同时,且可以处理部分可知的世界中的不确定问题,并得到概率最高可行的 但较Graphplan相比增加了处理不确定规划的能力,即概率规划的操作域的操作具有多个 可能输出,每一个输出都伴随一个概率值表示产生这种输出的可能性。用这种方法定义动 作的好处是: (1)对于我们知道的可能存在的输出,我们可以准确地把动作模型化,并且根据经 验对于每一个输出给定一个符合实际的概率值。 (2)对于我们不知道的可能输出,我们假设动作没有产生结果,即动作没有改变世 界状态,也赋给这个输出一个概率值。这种方法虽然并不十分准确,但是它占有一个动作 的输出的可能性,所以也能在生成规划中起到作用。 圈l具有概率操作实例化的动作示例20_uostairs 如上图所示,机器人的上楼动作可能有0.6的可能性上楼去,也可能有

文档评论(0)

1亿VIP精品文档

相关文档