《面向结构的基于学习的规划方法-论文》.pdfVIP

  • 3
  • 0
  • 约2.42万字
  • 约 18页
  • 2016-01-04 发布于河南
  • 举报

《面向结构的基于学习的规划方法-论文》.pdf

《面向结构的基于学习的规划方法-论文》.pdf

1746 JournalofSoftware软件学报 Vo1.25,No.8,August2014 1 符号约定及相关定义 为了描述 “子问题.规划片段”形式的先验知识,我们需要用到性质、动作片段等概念.最初提 出性质这一概 念的是 Fox等人 H【,】.性质p用某对象在该谓词中出现的位置作为该谓词的下标进行表示,n元谓词共有 n个性 质,,,...,.性质集合用力表示.表示状态,o表示规划对象,ss= o表示对象 D在状态 中拥有的性质集合,称 SS为对象0的子状态.藏 示一个谓词,p表示一个命题. 表示谓词 勺第i个参数为0的部分例化谓词. =o表 示被0部分例化的子状态.SS=o表示状态 下0的命题子状态. 类似于性质 的定义,动作片段 由某对象在该动作模型中出现的位置作为该动作名称的下标表示,n个参数 的动作定义了n个动作片段 ,,...,.有时为了突出规划对象,又用 = o表示某实例动作a关于对象 。的动 作片段(;表示对象 。的F投影,这里,‘’代表 “动作片段”的含义).动作片段集用 表示. 表示领域D动作模 型 m的第 i个参数被0例化后得到的部分例化动作模型. Mali研究了基于可满足框架下的规划合并和规划重用 【】.类似地,为了能够将先验知识在可满足框架下进 行合并和重用,我们需要用到以下符号: 表示规划步,af表示基动作.u表示领域中所有命题uf的集合,Uf(表示U,在时间步t成立.婊 示空动作. 是包含空动作 的基动作集.· 时间步 ,成立,表示时间步 ,无其他非空动作.也就是说,空动作 其他非空动作 互斥.(P尸 ,)表示 step--~action映射,或称将aj绑定到规划步Pa(,)表示动作 a在时间步 执行 (口f的前件在时间 步_,成立,其效果在时间步(,+1)成立).P ,,表示 先于P.k『i表示第fth条先验知识的动作片段数,m表示需要合 并的先验知识数a表示来 自ith(ie[1,])先验知识jth(i~[1,kd).K表示m条先验知识需要合并的动作片段总数. 2 问题定义 经典规划问题表示成 Prob=(X,I,G),其中, (, 表示规划领域, 表示状态集合, 表示动作模型集合, 表示确定型状态转移函数 : ,表示初始状态,G表示 目标状态.动作模型定义为动作头部连同前提条件 和效果,其中,动作头部由动作名称及零个或多个参数构成.规划 (解)是能使初始状态砖专换成 目标状态G的动作 序列(口o,a ..,口). 本文的学习问题可被描述为:给定规划 问题Prob,规划对象集D,规划(解)So1.作为学习的结果,SOLP(I作在 学习状态)将输出先验知识列表 本文的带先验知识的规划 问题可被描述为:给定规划问题 Prob,先验知识列表 作为规划的结果,SOLP(SE 作在规划状态1输出最终解. 定义 1(状态 s的结构).任一合法状态 ,可表示成类似 =(。ISS1-}-O2SS2+…+(0f+D f+…+0SS)的形式,其中, 01,02….,0表示 S中的对象;f表示对象 0f在状态 下所拥有的性质,即SSf= ∈ ;项(of+0 表示在状态 S 下,对象0,oj拥有公共子状态SS,称这些互异的子状态集 {SS SS ..,SS}构成了状态S的结构,记为 . 例如,图 2中第一个 问题的初试状态 可表示成(+曰+C)(ontable1,clear1)),因此,初试状态 的结构为Or= (ontable1,clear1).类似地,该 问题的目标状态G可表示成(C(onl,clear1) (01,on2)+B(ontable1,on2)),目标状态G的 结构为OG=(onl,clear1)+(onl,on2)+(ontablel,on2). 定义 2(子 问题(sub-problem)).给定规划 问题Prob,类型为 t的对象 0的子 问题 (D)=(f,0,Gp). 若不考虑具体对象,则忽略参数 07而简记为 sp=t,/p,Gp). (f,易G ,Spp=(t,lp,)分别表示谓词子问题和命 题子问题. 例如,图2中第 1个问题中关于积木块 的子问题 sp=(block,A,(ontable1,clear1),(onl,on2)). 定义3(子问题等价).两个子问题sp=(,0i,;,G),spf=(tj,D,, ,G)相等当且仅当: · t~ti:of,D,是同一类型对象;

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档