- 12
- 0
- 约4.37千字
- 约 22页
- 2017-09-16 发布于湖北
- 举报
BCPS:具有感知行动的双向规划
BCPS:具有感知行动的双向规划算法 BCPS: Bi-direction Conditional Planning with Sensing actions 本文的组织 第1章——概略描述经典规划中,需要解决的问题及其在不完备信息下进行规划所存在的局限,由此引出感知行动和条件规划,并介绍了基于环境空间的规划搜索策略。 第2章——介绍了BCPS的形式化描述,给出了非感知行动、感知行动的形式化描述,并定义了条件规划。 第3章——定义了环境间的正向、反向转移函数。 第4章——详细描述了BCPS的搜索策略,讨论了正向、反向搜索算法,在此基础上给出了双向搜索算法。 第5章——对本文的总结及未来的工作。 经典规划的局限 经典规划基于以下假设:在初始环境中,agent具备规划所需要的全部知识,最后形成的规划是一个简单的行动序列。 上述的假设带有很大的局限性,实际很多情况下,agent对于环境的知识是不完备的,如果一些必要的状态变量值未知,则经典规划无解。因此,需要执行相应的感知行动,获得规划所需的状态信息。 本文提出的双向规划算法BCPS引入了感知行动,算法所得的规划不再是单一的行动序列,而是条件规划。 具有感知行动的规划搜索策略 正向搜索策略:由初始环境到目标环境方向上执行搜索。优点:对行动的可执行条件判断较简单;缺点:规划出现的分支较多,生成的环境空间过大; 反向搜索策略:由目标环境到初始环境方向上执行搜索。优点:规划分支较少;缺点:对行动的可执行条件判断相对较难; 双向搜索策略(本算法):正向、反向搜索不可避免会出现环境指数爆炸问题,双向搜索同时在两个方向上执行搜索。优点:一般情况下,可以避免环境空间的过度扩展;缺点:每一步都需要判断正向、反向所得的条件规划能否构成解,增加了额外的开支。 BCPS规划算法须解决的问题 行动的形式化描述——行动要具有可执行条件、相应的结果说明、相对于该结果的前提条件。 BCPS的语义描述——描述环境间由于行动而发生转移的推理机制,即根据行动的形式化描述,给出行动执行后的结果环境。本文以转移函数进行语义描述,并对非感知行动和感知行动在正向和反向两个方向分别定义环境转移函数。 算法输出解的定义——给出一个条件规划是否为解的判断依据。 算法的搜索策略——双向执行宽度优先搜索策略。 BCPS的形式化描述 1. BCPS规划问题表示由一个四元组表示:P=M,A,I,G, 其中: M为状态的有限集; A为行动的有限集; I为初始环境,可能是不完备的。 G为目标环境。 BCPS的形式化描述(续) 2. 行动描述 本文对非感知行动和感知行动严格区分:非感知行动:不但改变外部环境的状态值,同时也改变agent对于外部环境的认知状态;感知行动:不改变外部环境的状态值,只改变agent对于外部环境的认知程度。 非感知行动由以下ef-命题描述:a causes f if pre(a,f) 感知行动由下述k-命题描述: a senses f if exc(a,f) 行动的可执行条件由以下ex-命题描述: executable a if Poss(a) BCPS的形式化描述(续) 条件规划定义: 空的行为序列,记为[],是条件规划; 若a是非感知行为,则a是条件规划; 若a是感知行为,?1...?n是互斥的状态文字,表示感知行动的感知结果,c1…cn(n0)是条件规划,则以下是条件规划 a;case[?1→c1,…, ?n→cn] 若c1,c2是条件规划,则c1;c2是条件规划; 只有以上是条件规划。 BCPS的语义描述 1. 基本概念 状态——对于真实世界某一属性的谓词描述,状态取值为true,false,unkown; 环境(situation)——所有状态的集合; Agent的环境认知——值为已知的状态集合。简记为k-situ; 为推理上的需要,我们将k-situ表示为??T,F,其中T={f |f?? ,?是k-situ,f是状态文字且已知为真} F={f | f?? ,?是k-situ,f是状态文字且已知为假} 环境的解释 部分解释:给定一个状态集合S,对S的一个部分解释是对S中的某些状态赋值v={true,false},记为I(Q)=TQ,FQ,Q是状态集,且Q?S。 完备解释:给定一个状态集合S,对S的一个完备解释是对S中的每个状态赋值v={true,false},记为I(S)=TS,FS,其中TS∪FS=S, TS∩FS=? 。 BCPS的语义描述(续) 2. 转移函数 正向转移函数:?1=Image(a,?) 在环境?中执行一个行动a,根据该行动的命题描述a causes f if pre(a,f),计算行动a执行后的结果环境?1,行动a执行的
您可能关注的文档
- astronomy:the_science_of_the_stars._reading.ppt
- auroCAD2010对象捕捉教程.ppt
- Ausic实施方案.doc
- autoCAD教程,详细解答.ppt
- atlas小机型介绍.ppt
- Autocad多图操作与外部引用.ppt
- AutoCAD2007制图员题解第六单元.doc
- Audit 模版.ppt
- AVG应用和介绍.ppt
- A口钻孔桩施工技术交底.doc
- 25-26学年政治(部编版)选择性必修第二册课件:第1单元 周清1 民法中的人身权及财产权.pptx
- 25-26学年政治(部编版)选择性必修第二册课件:1.4.1 权利保障 于法有据.pptx
- 2025北京丰台区高二(上)期中地理(A卷)含答案.docx
- 2025北京三帆中学初三(上)开学考英语试题含答案.docx
- 2025北京一零一中初三9月月考语文试题含答案.docx
- 2025北京海淀区初三(上)期中道法试题含答案.docx
- 2025北京丰台区高一(上)期中政治(A卷)含答案.docx
- 25-26学年政治统编版必修4课件:3.3 唯物辩证法的实质与核心.pptx
- 25-26学年政治统编版必修4课件:7.2 正确认识中华传统文化.pptx
- 湖北省部分高中2026届高三上学期二模联考 历史试卷.docx
最近下载
- 附录B规范性附录AGC性能指标计算及补偿-中国电力企业联合会.DOC
- 山东省烟台市蓬莱区2022-2023学年六年级上学期期末数学试题(五四学制) (含答案解析).docx VIP
- YQ-15-烟用材料许可使用物质名 单系列标准.pdf VIP
- 2019-2020学年四川成都锦江区五年级上册语文期末试卷及答案.pdf
- 基于ABAQUS的动力总成悬置支架仿真分析方法研究.docx VIP
- 【三套试卷】【浙教版】小学三年级数学上册第一单元教材检测题附答案.pdf VIP
- EMT会议管理制度.docx VIP
- 十年(2016-2025)高考物理真题分类汇编(全国通用)-专题23 法拉第电磁感应定律.docx VIP
- 渠道维护工高级技师考试答案(强化练习).docx VIP
- 动量和能量中的滑板块模型专题.docx VIP
原创力文档

文档评论(0)