- 0
- 0
- 约1.87万字
- 约 29页
- 2026-01-23 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN115049003B(45)授权公告日2025.01.10
(21)申请号202210684822.0
(56)对比文件
(22)申请日2022.06.16
CN113705187CN113807171
A,2021.11.26
A,2021.12.17
(65)同一申请的已公布的文献号
申请公布号CN115049003A
审查员夏凯茜
(43)申请公布日2022.09.13
(73)专利权人京东科技信息技术有限公司
地址100176北京市大兴区经济技术开发
区科创十一街18号院2号楼6层601
(72)发明人陶大程丁亮钟起煌
(74)专利代理机构北京品源专利代理有限公司
11332
专利代理师赵迎迎(51)Int.CI.
GO6F18/214(2023.01)
GO6N3/08(2023.01)
权利要求书2页
说明书10页附图4页
(54)发明名称
一种预训练模型微调方法、装置、设备和存储介质
(57)摘要
CN115049003B本发明实施例公开了一种预训练模型微调方法、装置、设备和存储介质。该方法包括:获取与目标下游任务相关联的第一样本数据;基于预设统计语言模型,对第一样本数据进行数据领域分析,并基于领域分析结果,从第一样本数据中确定与目标下游领域相匹配的第二样本数据;基于目标下游任务对应的实际样本数据,对预训练模型进行微调确定第一微调模型;基于第一微调模型对第二样本数据进行去噪处理,获得去噪后的第三样本数据;基于第三样本数据和实际样本数据,对第一微调模型进行再次微调,确定第二微调模型,并基于第二微调模型确定目标下游任
CN115049003B
S110
S110
获取与目标下游任务相关联的第一样本数据
基于预设统计语言模型,对第一样本数据进行数据领域分析,并基于
领域分析结果,从第一样本数据中确定与目标下游领域相匹配的第二
样本数据
S130
基于目标下游任务对应的实际样本数据,对预训练模型进行微调,确定第一微调模型
基于第一微调模型,对第二样本数据进行去噪处理,获得去噪后的第
三样本数据
S150
基于第三样本数据和实际样本数据,对第一微调模型进行再次微调,确定第二微调模型,并基于第二微调模型确定目标下游任务模型
S120
CN115049003B权利要求书1/2页
2
1.一种预训练模型微调方法,其特征在于,包括:
获取与目标下游任务相关联的第一样本数据;
基于预设统计语言模型,对所述第一样本数据进行数据领域分析,并基于领域分析结果,从所述第一样本数据中确定与目标下游领域相匹配的第二样本数据;
基于所述目标下游任务对应的实际样本数据,对预训练模型进行微调,确定第一微调模型;
基于所述第一微调模型,对所述第二样本数据进行去噪处理,获得去噪后的第三样本数据;
基于所述第三样本数据和所述实际样本数据,对所述第一微调模型进行再次微调,确定第二微调模型,并基于所述第二微调模型确定目标下游任务模型。
2.根据权利要求1所述的方法,其特征在于,所述基于预设统计语言模型,对所述第一样本数据进行数据领域分析,并基于领域分析结果,从所述第一样本数据中确定与目标下游领域相匹配的第二样本数据,包括:
将每个所述第一样本数据输入至预设统计语言模型中进行数据领域分析,确定每个所述第一样本数据对应的数据领域为目标下游领域的概率值;
基于各个所述概率值和预设概率值阈值范围,从各个所述第一样本数据中确定与目标下游领域相匹配的第二样本数据。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一微调模型,对所述第二样本数据进行去噪处理,获得去噪后的第三样本数据,包括:
将每个所述第二样本数据输入至所述第一微调模型中,确定每个所述第二样本数据对应的输出结果;
基于各个第二样本数据对应的输出结果和实际标签,对各个第二样本数据进行去噪处理,获得去噪后的第三样本数据。
4.根据权利要求3所述的方法,其特征在于,所述基于各个第二样本数据对应的输出结果和实际标签,对各个第二样本数据进行去噪处理,获得去噪后的第三样本数据,包括:
检测每个第二样本数据对应的输出结果和相应的实际标签是否一致;
将检测到的输出结果与实际标签一致的各个第二样本数据确定为去燥后的第三样本数据。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第三样
您可能关注的文档
- CN114505989B 树脂供给装置、树脂密封装置和树脂密封品的制造方法 (山田尖端科技株式会社).docx
- CN114511714B 物体识别装置和物体识别方法 (株式会社日立制作所).docx
- CN114518846B 数据处理方法及装置 (阿里巴巴(中国)有限公司).docx
- CN114548031B 信号检测方法和装置 (长鑫存储技术有限公司).docx
- CN114559923B 一种无人驾驶车辆自动紧急避障系统及其控制方法 (湖北汽车工业学院).docx
- CN114580160B 一种用于含裂纹功能梯度板传热问题的非局部方法 (河海大学).docx
- CN114599550B 座椅以及座椅的制造方法 (德鱼塔工业股份有限公司).docx
- CN114611605B 一种关系网络小样本图像分类方法、系统、装置及介质 (华南理工大学).docx
- CN114613965B 磷酸铁锂-碳复合材料的制备方法及其应用 (宜昌邦普循环科技有限公司).docx
- CN114630448B 通信控制方法 (京瓷株式会社).docx
最近下载
- 重症肺结核诊断和治疗专家共识.pptx VIP
- 某某市税务局“岗位大练兵 业务大比武”活动实施方案范本.doc VIP
- T∕CSAE 91-2018 汽车生命周期温室气体及大气污染物排放评价方法.pdf
- 个人独资企业章程.pdf VIP
- 2026年中小学寒假安全教育主题班会课件PPT.pptx VIP
- 5 《火灾自动报警系统施工及验收规范》(GB50166--92)附表.pdf VIP
- 光伏电站并网启动调试方案.pdf VIP
- pNC系统载体使用说明.PDF
- 小学篮球兴趣小组教学计划范文(32篇).docx VIP
- 山东省临沂市罗庄区2024-2025学年七年级上学期期末考试地理试题.pdf VIP
原创力文档

文档评论(0)