CN119623525A 一种可提升对话模型效果的解码训练方法 (四川大学).docxVIP

  • 2
  • 0
  • 约8.77千字
  • 约 16页
  • 2026-05-29 发布于山西
  • 举报

CN119623525A 一种可提升对话模型效果的解码训练方法 (四川大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119623525A

(43)申请公布日2025.03.14

(21)申请号202510165871.7

(22)申请日2025.02.14

(71)申请人四川大学

地址610065四川省成都市武侯区一环路

南一段24号

(72)发明人龚勋刘海峰

(74)专利代理机构成都知棋知识产权代理事务所(普通合伙)51325

专利代理师马晓静

(51)Int.Cl.

G06N3/0455(2023.01)

G06N3/042(2023.01)

G06N3/084(2023.01)

G06F16/36(2019.01)

权利要求书2页说明书5页附图2页

(54)发明名称

一种可提升对话模型效果的解码训练方法

(57)摘要

CN119623525A本申请提供一种可提升对话模型效果的解码训练方法,包括:步骤1、数据输入:将一段包含n轮问题的对话c=(c,cz,cn)、与所述n轮问题相关的知识以及所述问题的回复输入至大语言模型中;步骤2、数据预处理:所述大语言模型的嵌入向量层对输入的对话C、知识K和回复Y进行预处理,并分别输出问题向量、知识向量和回复向量;步骤3、大语言模型训练:以开源大模型作为大语言模型的基模型进行集成学习和训练;本申请方法通过定位学习重点、

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档