基于分层次和草图式归纳逻辑的迁移强化学习方法及系统.pdfVIP

  • 1
  • 0
  • 约2.6万字
  • 约 20页
  • 2023-09-13 发布于四川
  • 举报

基于分层次和草图式归纳逻辑的迁移强化学习方法及系统.pdf

本发明提供一种基于分层次和草图式归纳逻辑的迁移强化学习方法及系统,包括:步骤S1,提供用于描述状态和动作的原子集合,根据原子集合成成对应的逻辑片段,通过策略梯度调整所述逻辑片段中每条逻辑子程序的权重;步骤S2,通过近端策略优化算法初始化底层策略;步骤S3,通过使用命令式的控制流模块分别实现上层归纳逻辑编程的建模以及底层的深度强化学习;步骤S4,进行多源策略迁移强化学习,对策略更新后和策略更新前的逻辑片段重合度进行计算,为逻辑片段重合度加上重合度权重,然后将所述重合度权重加入至平均探索收益,以实现

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116739076 A (43)申请公布日 2023.09.12 (21)申请号 202310339308.8 (22)申请日 2023.03.31 (71)申请人 天津大学 地址 300073

文档评论(0)

1亿VIP精品文档

相关文档