- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN120235216A(43)申请公布日2025.07.01
(21)申请号202510726044.0
(22)申请日2025.06.03
(71)申请人小哆智能科技(北京)有限公司
地址100094北京市海淀区西北旺东路10
号院东区23号楼三层346室
(72)发明人刘晓玉余国军
(74)专利代理机构北京睿博行远知识产权代理有限公司11297
专利代理师赵敏
(51)Int.CI.
GO6N3/096(2023.01)
GO6N3/042(2023.01)
GO6N3/084(2023.01)
GO6N3/045(2023.01)
权利要求书2页说明书8页附图2页
(54)发明名称
大模型动态知识蒸馏方法及系统
(57)摘要
CN120235216A本发明实施例提供一种大模型动态知识蒸馏方法及系统,属于大模型动态知识蒸馏领域;该方法包括获取问答对数据集,使用所述学生模型对所述训练输入问答对进行编码,生成第一软标签;执行蒸馏,再次使用所述学生模型对所述训练输入问答对进行编码,生成第二软标签;计算所述学生模型的预测不确定值和区分能力;动态调整蒸馏强度权重和蒸馏温度值;迭代执行训练所述学生模型的过程,直至所述学生模型的性能指标达到预设阈值,完成动态知识蒸馏。本发明通过动态调节蒸馏参数,提高了模型输出稳定,降低了模糊样本的噪声,并且在解读类任务
CN120235216A
获取政务领域问答对数据集,随机采集所述问答对数
获取政务领域问答对数据集,随机采集所述问答对数据集中的输入问答对,并将所述输入问答对划分为训
练输入问答对和微调输入问答对
加载预训练语言模型作为学生模型,并使用所述学生
模型对所述训练输入问答对进行编码,生成第一软标
签
执行蒸馏,再次使用所述学生模型对所述训练输入问答对进行编码,生成第二软标签
根据所述第一软标签与所述第二软标签,计算所述学生模型的预测不确定性和区分能力
根据所述预测不确定性和所述区分能力,动态调整蒸馏强度权重和蒸馏温度值
迭代执行训练所述学生模型的过程,直至所述学生模型的性能指标达到预设阈值,完成动态知识蒸馏
S100
S200
S300
S400
S600
CN120235216A权利要求书1/2页
2
1.一种大模型动态知识蒸馏方法,其特征在于,包括:
获取领域问答对数据集,随机采集所述问答对数据集中的输入问答对,并将所述输入问答对划分为训练输入问答对和微调输入问答对;
加载预训练语言模型作为学生模型,并使用所述学生模型对所述训练输入问答对进行编码,生成第一软标签;
执行蒸馏,再次使用所述学生模型对所述训练输入问答对进行编码,生成第二软标签;
根据所述第一软标签与所述第二软标签,计算所述学生模型的预测不确定值和区分能力;
根据所述预测不确定值和所述区分能力,动态调整蒸馏强度权重和蒸馏温度值;
迭代执行训练所述学生模型的过程,直至所述学生模型的性能指标达到预设阈值,完成动态知识蒸馏。
2.根据权利要求1所述的大模型动态知识蒸馏方法,其特征在于,所述计算所述学生模型的预测不确定值和区分能力包括:
将所述训练输入问答对输入学生模型进行预测,生成每个可能的输出类别的概率分布,该概率分布为当前轮的第二软标签;
通过概率方差量化所述第二软标签的离散性,得到预测不确定值;
设置第一方差阈值,若预测不确定值小于等于第一方差阈值,则判定当前所述学生模型的预测不确定值低;若预测不确定值大于第一方差阈值,则判定当前所述学生模型的预测不确定值高。
3.根据权利要求2所述的大模型动态知识蒸馏方法,其特征在于,所述计算所述学生模型的预测不确定值和区分能力还包括:
调取所述第一软标签,通过相对熵量化所述第一软标签与第二软标签的分布差异,得到区分能力值;
设置第一区分能力阈值,若区分能力值小于等于第一区分能力阈值,则判定当前所述学生模型区分能力强,若区分能力值大于第一区分能力阈值,则判定当前所述学生模型区分能力弱。
4.根据权利要求3所述的大模型动态知识蒸馏方法,其特征在于,所述根据所述预测不确定值和所述区分能力,动态调整蒸馏强度权重和蒸馏温度值,包括:
若当前所述学生模型的预测不确定值低,则增大蒸馏强度权重,若当前所述学生模型的预测不确定值高,则减小蒸馏强度权重;
若当前所述学
您可能关注的文档
- CN119760646B8 基于机器视觉的重载大抱具驱动轮多模态损伤检测方法 (杨明川).docx
- CN119763660B 一种基于环境dna和机器学习的水体污染物溯源方法 (同济大学).docx
- CN119783732B 一种基于多源遥感技术的找矿方法、装置、设备及介质 (云南大学).docx
- CN119785380B 一种基于煤矿场景的跨模态行人重识别方法 (济宁安泰矿山设备制造有限公司).docx
- CN119787351B 基于时序数据分析的电力网络拓扑优化方法 (安徽方能电气技术有限公司).docx
- CN119788969B 用于扫码摄像头角度自适应调节方法、系统及电子设备 (深圳市欧森纳斯科技有限公司).docx
- CN119795175B 一种基于多智能体强化学习的灵巧双手协同控制方法 (北京联合大学).docx
- CN119804335B 基于光取向液晶芯片的快照穆勒矩阵偏振成像装置及方法 (浙江大学).docx
- CN119811510B 一种单细胞Hi-C数据增强方法、系统及存储介质 (中山大学).docx
- CN119813228B 基于LLM Agent的电力系统运行方式自适应计算方法 (山东大学).docx
原创力文档


文档评论(0)