规划编制以在规划时间推理目标实现.pdfVIP

  • 0
  • 0
  • 约2.08万字
  • 约 5页
  • 2026-03-06 发布于北京
  • 举报

规划编制以在规划时间推理目标实现.pdf

规划编制以在规划时间推理目标实现

AlbertoPozanco,MarianelaMorales,DanielBorrajo,ManuelaVeloso

J.P.MorganAIResearch

{alberto.pozancolancho,marianela.moraleselena}@,{name.surname}@

Abstract

识别在解决规划任务时实现目标的具体行动可能对各种

规划应用有益。传统上,这种识别发生在搜索之后,因

为某些动作可能会暂时实现目标,而这些目标随后又被

其他动作撤销并重新实现。本文中,我们提出了一种扩

本展原始规划任务的编译方法,通过添加强制执行特定目

译标持久性的commit动作,使规划器能够在规划过程中

中识别永久性目标达成。实验结果表明,在进行最优和次图1:推箱子任务中,两个智能体负责将石头推到它们

优规划时解决重构的任务不会带来任何额外开销,同时的目标位置(绿色)。

2为某些下游任务提供有用信息。

v

5定目标实现分布而非其他分布的计划。例如,更倾向于

41介绍将目标分配给代理时采用更多公平分布;或者减少连续

5

9自动规划涉及确定一系列操作或计划,以从初始达成的目标之间动作数量的计划。

0本文中,我们介绍了一个编译(Nebel2000),该编

.状态实现一组目标(Ghallab,Nau,andTraverso2004)。

3译通过纳入承诺行动扩展了原始规划任务。这些行动使

0在解决规划任务时识别出具体达成目标的操作可能对规划者能够确保特定目标一旦达成即保持不变,从而在

5各种规划应用有益。例如,在集中式多代理规划中将

2目标的达成归因于特定代理是有价值的(Pozancoand搜索子树内对其作出承诺。这种方法允许规划者在规划

:阶段确定某个行动何时永久性地实现了一个目标。在之

vBorrajo2022);或者分析整个计划中的目标实现分布。

i前的索科班示例中,代理将有两种选择:要么执行标准

x然而,这种识别只能通过在规划结束时分析返回的计划

r推行动,要么执行一个推-commit行动,这可以保证石

a来完成,因为某些操作可能会暂时达成后来被其他操作

头在其剩余的规划期内保持在目标位置。

撤销并重新达成的目标。

实验结果在一个全面的基准测试中表明,解决重新

考虑图1中所示的索克班任务,其中两个代理负责

表述的任务不会产生额外的开销,无论是最优规划还是

将石头推到它们各自的目标位置,这些目标位置用绿色

次优规划。这突显了我们的编译在规划阶段能够不增加

标记。完成此任务的一种可能计划涉及橙色代理先向右

任何额外开销的情况下进行目标达成推理。

推动一块石头三次,然后蓝色代理向下推动另一块石

头一次。在这个计划中,第一块石

文档评论(0)

1亿VIP精品文档

相关文档