CN115049003B 一种预训练模型微调方法、装置、设备和存储介质 (京东科技信息技术有限公司).docxVIP

  • 0
  • 0
  • 约1.87万字
  • 约 29页
  • 2026-01-23 发布于重庆
  • 举报

CN115049003B 一种预训练模型微调方法、装置、设备和存储介质 (京东科技信息技术有限公司).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN115049003B(45)授权公告日2025.01.10

(21)申请号202210684822.0

(56)对比文件

(22)申请日2022.06.16

CN113705187CN113807171

A,2021.11.26

A,2021.12.17

(65)同一申请的已公布的文献号

申请公布号CN115049003A

审查员夏凯茜

(43)申请公布日2022.09.13

(73)专利权人京东科技信息技术有限公司

地址100176北京市大兴区经济技术开发

区科创十一街18号院2号楼6层601

(72)发明人陶大程丁亮钟起煌

(74)专利代理机构北京品源专利代理有限公司

11332

专利代理师赵迎迎(51)Int.CI.

GO6F18/214(2023.01)

GO6N3/08(2023.01)

权利要求书2页

说明书10页附图4页

(54)发明名称

一种预训练模型微调方法、装置、设备和存储介质

(57)摘要

CN115049003B本发明实施例公开了一种预训练模型微调方法、装置、设备和存储介质。该方法包括:获取与目标下游任务相关联的第一样本数据;基于预设统计语言模型,对第一样本数据进行数据领域分析,并基于领域分析结果,从第一样本数据中确定与目标下游领域相匹配的第二样本数据;基于目标下游任务对应的实际样本数据,对预训练模型进行微调确定第一微调模型;基于第一微调模型对第二样本数据进行去噪处理,获得去噪后的第三样本数据;基于第三样本数据和实际样本数据,对第一微调模型进行再次微调,确定第二微调模型,并基于第二微调模型确定目标下游任

CN115049003B

S110

S110

获取与目标下游任务相关联的第一样本数据

基于预设统计语言模型,对第一样本数据进行数据领域分析,并基于

领域分析结果,从第一样本数据中确定与目标下游领域相匹配的第二

样本数据

S130

基于目标下游任务对应的实际样本数据,对预训练模型进行微调,确定第一微调模型

基于第一微调模型,对第二样本数据进行去噪处理,获得去噪后的第

三样本数据

S150

基于第三样本数据和实际样本数据,对第一微调模型进行再次微调,确定第二微调模型,并基于第二微调模型确定目标下游任务模型

S120

CN115049003B权利要求书1/2页

2

1.一种预训练模型微调方法,其特征在于,包括:

获取与目标下游任务相关联的第一样本数据;

基于预设统计语言模型,对所述第一样本数据进行数据领域分析,并基于领域分析结果,从所述第一样本数据中确定与目标下游领域相匹配的第二样本数据;

基于所述目标下游任务对应的实际样本数据,对预训练模型进行微调,确定第一微调模型;

基于所述第一微调模型,对所述第二样本数据进行去噪处理,获得去噪后的第三样本数据;

基于所述第三样本数据和所述实际样本数据,对所述第一微调模型进行再次微调,确定第二微调模型,并基于所述第二微调模型确定目标下游任务模型。

2.根据权利要求1所述的方法,其特征在于,所述基于预设统计语言模型,对所述第一样本数据进行数据领域分析,并基于领域分析结果,从所述第一样本数据中确定与目标下游领域相匹配的第二样本数据,包括:

将每个所述第一样本数据输入至预设统计语言模型中进行数据领域分析,确定每个所述第一样本数据对应的数据领域为目标下游领域的概率值;

基于各个所述概率值和预设概率值阈值范围,从各个所述第一样本数据中确定与目标下游领域相匹配的第二样本数据。

3.根据权利要求1所述的方法,其特征在于,所述基于所述第一微调模型,对所述第二样本数据进行去噪处理,获得去噪后的第三样本数据,包括:

将每个所述第二样本数据输入至所述第一微调模型中,确定每个所述第二样本数据对应的输出结果;

基于各个第二样本数据对应的输出结果和实际标签,对各个第二样本数据进行去噪处理,获得去噪后的第三样本数据。

4.根据权利要求3所述的方法,其特征在于,所述基于各个第二样本数据对应的输出结果和实际标签,对各个第二样本数据进行去噪处理,获得去噪后的第三样本数据,包括:

检测每个第二样本数据对应的输出结果和相应的实际标签是否一致;

将检测到的输出结果与实际标签一致的各个第二样本数据确定为去燥后的第三样本数据。

5.根据权利要求1所述的方法,其特征在于,所述基于所述第三样

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档