CN119623564A 结合广义优势估计和模态分解交互的离线强化学习方法 (中北大学).docxVIP

  • 1
  • 0
  • 约2.8万字
  • 约 43页
  • 2026-05-29 发布于山西
  • 举报

CN119623564A 结合广义优势估计和模态分解交互的离线强化学习方法 (中北大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119623564A

(43)申请公布日2025.03.14

(21)申请号202411694561.6

(22)申请日2024.11.25

(71)申请人中北大学

地址030051山西省太原市学院路3号

(72)发明人王晋光靳凯欣王丽芳郭威韩强

(74)专利代理机构太原申立德知识产权代理事务所(特殊普通合伙)14115

专利代理师孙乐

(51)Int.Cl.

G06N3/092(2023.01)

G06N3/0464(2023.01)

G06N3/0455(2023.01)

G06N3/0499(2023.01)

G06F18/15(2023.01)

G06F18/25(2023.01)

G06F18/27(2023.01)

G06N3/048(2023.01)

G06F123/02(2023.01)

权利要求书4页说明书15页附图4页

(54)发明名称

结合广义优势估计和模态分解交互的离线

强化学习方法

(57)摘要

CN119623564A本发明属于离线强化学习,具体涉及结合广义优势估计和模态分解交互的离线强化学习方法。为解决基于TransFormer的离线强化学习方法中轨迹拼接能力不足,以及轨迹中多模态信息的模态

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档