在部分观测环境下学习规划领域的派生谓词规则.pdfVIP

  • 5
  • 0
  • 约4.7万字
  • 约 14页
  • 2016-03-09 发布于天津
  • 举报

在部分观测环境下学习规划领域的派生谓词规则.pdf

在部分观测环境下学习规划领域的派生谓词规则.pdf

第 38卷 第 7期 计 算 机 学 报 Vo1.38 NO.7 2015年 7月 CHINESEJOURNAL oF C0MPUTERS July2015 在部分观测环境下学习规划领域的派生谓词规则 饶东宁” 蒋志华 姜云飞。 邓玉辉’ ”(广东工业大学计算机学院 广州 510090) 。(暨南大学信息科学与技术学院计算机科学系 广州 510632) 。(中山大学信息科学与技术学院软件研究所 广东 510275) 摘 要 文中提出了一种在部分观测环境下学习规划领域 的派生谓词规则的方法.在规划领域描述语言 (PDDL) 中,派生谓词用来描述动作 的非直接效果 ,是规划领域模型和搜索控制知识 的重要组成部分.然而 ,对于大多数规 划领域而言,从无到有地构造派生谓词规则是不容易的.因此 ,研究 自动获取派生谓词 的推导规则是有意义的.已 有研究工作提出通过修订一个初始的不完备的领域理论来获取推导规则的方法,但是它们的主要缺点在于待学习 谓词的训练例 的数量非常少 ,这是因为训练例按照非常有限的方式来生成.而更本质 的原因在于它们假设环境是 不可观测的.其实 ,在现实生活 中很多动作 的非直接效果是可 以观测 的,或者通过简单 的 目测或者通过专 门的工 具.因此文中提出增加观测来反映动作的非直接效果,以便增加待学习谓词的训练例数 目从而改善学习的精准度. 此外,为了补充一些在归纳学习过程 中学习不到的谓词 ,文 中还提 出了一个后处理方法来使得学习到的规则在语 义上更完整.通过在派生谓词基准领域上 的实验表 明,文 中所提 出的方法是可行有效的.更深远 的意义在于,文 中 的研究工作有利于规划领域的自动建模或者控制知识的自动获取的研究与实现. 关键词 人工智能;自动规划 ;派生谓词 ;规则学习;部分观测 中图法分类号 TP182 DOI号 10.11897/SP.J.1016.2015.01372 LearningDerivedPredicateRulesforPlanningDomainsunderPartialObservability RAODong—Ning” JIANG Zhi—Hua∞ JIANG Yun—Fei。 DENG Yu—Hui。 ”(SchoolofComputer,GuangdongUniversityofTechnology,Guangzhou 510090) (DepartmentofComputerScience。SchoolofInformationScienceandTechnology,JinanUniversity,Guangzhou 510632) ”(SoftwareResearchInstitute,SchoolofInformationScienceandTechnology,SunYat-senUniversity,Guangzhou 510275) Abstract Thispaperpresentsamethodtolearnderivedpredicaterulesforplanningdomainsunder partialobservability.InthePDDL (PlanningDomainDescriptionLanguage),derivedpredicates area compactway to describe indirecteffectsofactions,and an importantpartofplanning domainmodelsorsearcheontrolknowledge.However,formostplanningdomains,itisnoteasy towritederivedpredicaterulesfrom scratch,evenforexperts.Therefore,itisworthyofstudyin

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档