- 1
- 0
- 约2.6万字
- 约 20页
- 2023-09-13 发布于四川
- 举报
本发明提供一种基于分层次和草图式归纳逻辑的迁移强化学习方法及系统,包括:步骤S1,提供用于描述状态和动作的原子集合,根据原子集合成成对应的逻辑片段,通过策略梯度调整所述逻辑片段中每条逻辑子程序的权重;步骤S2,通过近端策略优化算法初始化底层策略;步骤S3,通过使用命令式的控制流模块分别实现上层归纳逻辑编程的建模以及底层的深度强化学习;步骤S4,进行多源策略迁移强化学习,对策略更新后和策略更新前的逻辑片段重合度进行计算,为逻辑片段重合度加上重合度权重,然后将所述重合度权重加入至平均探索收益,以实现
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 116739076 A
(43)申请公布日 2023.09.12
(21)申请号 202310339308.8
(22)申请日 2023.03.31
(71)申请人 天津大学
地址 300073
您可能关注的文档
最近下载
- 员工奖金保密协议9篇.docx VIP
- 2025年东莞市东华初级中学中考数学模拟试卷附答案解析.pdf
- 2026年河南质量工程职业学院单招职业适应性测试备考题库及答案解析.docx VIP
- 2024年河南质量工程职业学院单招职业适应性测试试题及答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性测试题库有答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性考试备考试题及答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性测试备考试题及答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性测试题库及答案解析.docx VIP
- 6.1《北方地区自然特征与农业》课件-2023-2024学年人教版地理八年级下册.pptx VIP
- 2025年高考英语全国卷Ⅰ续写分析与教学策略.pptx VIP
原创力文档

文档评论(0)