CN119783760A 一种智能体思维链的强化学习奖罚机制设计方法 (成都数默科技有限公司).docxVIP

  • 0
  • 0
  • 约1.35万字
  • 约 25页
  • 2026-06-26 发布于山西
  • 举报

CN119783760A 一种智能体思维链的强化学习奖罚机制设计方法 (成都数默科技有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119783760A

(43)申请公布日2025.04.08

(21)申请号202510283750.2

(22)申请日2025.03.11

(71)申请人成都数默科技有限公司

地址610000四川省成都市中国(四川)自

由贸易试验区成都高新区天府大道北段28号1栋2单元15层06号

(72)发明人王伟旭陈鹏严得荣

(74)专利代理机构成都天嘉知识产权代理有限

公司51211

专利代理师赵凯

(51)Int.Cl.

G06N3/092(2023.01)

G06N3/0464(20

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档