BCPS:具有感知行动的双向规划.pptVIP

  • 12
  • 0
  • 约4.37千字
  • 约 22页
  • 2017-09-16 发布于湖北
  • 举报
BCPS:具有感知行动的双向规划

BCPS:具有感知行动的双向规划算法 BCPS: Bi-direction Conditional Planning with Sensing actions 本文的组织 第1章——概略描述经典规划中,需要解决的问题及其在不完备信息下进行规划所存在的局限,由此引出感知行动和条件规划,并介绍了基于环境空间的规划搜索策略。 第2章——介绍了BCPS的形式化描述,给出了非感知行动、感知行动的形式化描述,并定义了条件规划。 第3章——定义了环境间的正向、反向转移函数。 第4章——详细描述了BCPS的搜索策略,讨论了正向、反向搜索算法,在此基础上给出了双向搜索算法。 第5章——对本文的总结及未来的工作。 经典规划的局限 经典规划基于以下假设: 在初始环境中,agent具备规划所需要的全部知识,最后形成的规划是一个简单的行动序列。 上述的假设带有很大的局限性,实际很多情况下,agent对于环境的知识是不完备的,如果一些必要的状态变量值未知,则经典规划无解。因此,需要执行相应的感知行动,获得规划所需的状态信息。 本文提出的双向规划算法BCPS引入了感知行动,算法所得的规划不再是单一的行动序列,而是条件规划。 具有感知行动的规划搜索策略 正向搜索策略:由初始环境到目标环境方向上执行搜索。 优点:对行动的可执行条件判断较简单; 缺点:规划出现的分支较多,生成的环境空间过大; 反向搜索策略:由目标环境到初始环境方向上执行搜索。 优点:规划分支较少; 缺点:对行动的可执行条件判断相对较难; 双向搜索策略(本算法):正向、反向搜索不可避免会出现环境指数爆炸问题,双向搜索同时在两个方向上执行搜索。优点:一般情况下,可以避免环境空间的过度扩展; 缺点:每一步都需要判断正向、反向所得的条件规划能否构成解,增加了额外的开支。 BCPS规划算法须解决的问题 行动的形式化描述——行动要具有可执行条件、相应的结果说明、相对于该结果的前提条件。 BCPS的语义描述——描述环境间由于行动而发生转移的推理机制,即根据行动的形式化描述,给出行动执行后的结果环境。本文以转移函数进行语义描述,并对非感知行动和感知行动在正向和反向两个方向分别定义环境转移函数。 算法输出解的定义——给出一个条件规划是否为解的判断依据。 算法的搜索策略——双向执行宽度优先搜索策略。 BCPS的形式化描述 1. BCPS规划问题表示 由一个四元组表示:P=M,A,I,G, 其中: M为状态的有限集; A为行动的有限集; I为初始环境,可能是不完备的。 G为目标环境。 BCPS的形式化描述(续) 2. 行动描述 本文对非感知行动和感知行动严格区分: 非感知行动:不但改变外部环境的状态值,同时也改变agent对于外部环境的认知状态; 感知行动:不改变外部环境的状态值,只改变agent对于外部环境的认知程度。 非感知行动由以下ef-命题描述:a causes f if pre(a,f) 感知行动由下述k-命题描述: a senses f if exc(a,f) 行动的可执行条件由以下ex-命题描述: executable a if Poss(a) BCPS的形式化描述(续) 条件规划定义: 空的行为序列,记为[],是条件规划; 若a是非感知行为,则a是条件规划; 若a是感知行为,?1...?n是互斥的状态文字,表示感知行动的感知结果,c1…cn(n0)是条件规划,则以下是条件规划 a;case[?1→c1,…, ?n→cn] 若c1,c2是条件规划,则c1;c2是条件规划; 只有以上是条件规划。 BCPS的语义描述 1. 基本概念 状态——对于真实世界某一属性的谓词描述,状态取值为 true,false,unkown; 环境(situation)——所有状态的集合; Agent的环境认知——值为已知的状态集合。简记为k-situ; 为推理上的需要,我们将k-situ表示为??T,F,其中 T={f |f?? ,?是k-situ,f是状态文字且已知为真} F={f | f?? ,?是k-situ,f是状态文字且已知为假} 环境的解释 部分解释:给定一个状态集合S,对S的一个部分解释是对S中的某些状态赋值v={true,false},记为I(Q)=TQ,FQ,Q是状态集,且Q?S。 完备解释:给定一个状态集合S,对S的一个完备解释是对S中的每个状态赋值v={true,false},记为I(S)=TS,FS,其中 TS∪FS=S, TS∩FS=? 。 BCPS的语义描述(续) 2. 转移函数 正向转移函数:?1=Image(a,?) 在环境?中执行一个行动a,根据该行动的命题描述 a causes f if pre(a,f),计算行动a执行后的结果环境?1,行动a执行的

文档评论(0)

1亿VIP精品文档

相关文档