CN120235216A 大模型动态知识蒸馏方法及系统 (小哆智能科技(北京)有限公司).docxVIP

CN120235216A 大模型动态知识蒸馏方法及系统 (小哆智能科技(北京)有限公司).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN120235216A(43)申请公布日2025.07.01

(21)申请号202510726044.0

(22)申请日2025.06.03

(71)申请人小哆智能科技(北京)有限公司

地址100094北京市海淀区西北旺东路10

号院东区23号楼三层346室

(72)发明人刘晓玉余国军

(74)专利代理机构北京睿博行远知识产权代理有限公司11297

专利代理师赵敏

(51)Int.CI.

GO6N3/096(2023.01)

GO6N3/042(2023.01)

GO6N3/084(2023.01)

GO6N3/045(2023.01)

权利要求书2页说明书8页附图2页

(54)发明名称

大模型动态知识蒸馏方法及系统

(57)摘要

CN120235216A本发明实施例提供一种大模型动态知识蒸馏方法及系统,属于大模型动态知识蒸馏领域;该方法包括获取问答对数据集,使用所述学生模型对所述训练输入问答对进行编码,生成第一软标签;执行蒸馏,再次使用所述学生模型对所述训练输入问答对进行编码,生成第二软标签;计算所述学生模型的预测不确定值和区分能力;动态调整蒸馏强度权重和蒸馏温度值;迭代执行训练所述学生模型的过程,直至所述学生模型的性能指标达到预设阈值,完成动态知识蒸馏。本发明通过动态调节蒸馏参数,提高了模型输出稳定,降低了模糊样本的噪声,并且在解读类任务

CN120235216A

获取政务领域问答对数据集,随机采集所述问答对数

获取政务领域问答对数据集,随机采集所述问答对数据集中的输入问答对,并将所述输入问答对划分为训

练输入问答对和微调输入问答对

加载预训练语言模型作为学生模型,并使用所述学生

模型对所述训练输入问答对进行编码,生成第一软标

执行蒸馏,再次使用所述学生模型对所述训练输入问答对进行编码,生成第二软标签

根据所述第一软标签与所述第二软标签,计算所述学生模型的预测不确定性和区分能力

根据所述预测不确定性和所述区分能力,动态调整蒸馏强度权重和蒸馏温度值

迭代执行训练所述学生模型的过程,直至所述学生模型的性能指标达到预设阈值,完成动态知识蒸馏

S100

S200

S300

S400

S600

CN120235216A权利要求书1/2页

2

1.一种大模型动态知识蒸馏方法,其特征在于,包括:

获取领域问答对数据集,随机采集所述问答对数据集中的输入问答对,并将所述输入问答对划分为训练输入问答对和微调输入问答对;

加载预训练语言模型作为学生模型,并使用所述学生模型对所述训练输入问答对进行编码,生成第一软标签;

执行蒸馏,再次使用所述学生模型对所述训练输入问答对进行编码,生成第二软标签;

根据所述第一软标签与所述第二软标签,计算所述学生模型的预测不确定值和区分能力;

根据所述预测不确定值和所述区分能力,动态调整蒸馏强度权重和蒸馏温度值;

迭代执行训练所述学生模型的过程,直至所述学生模型的性能指标达到预设阈值,完成动态知识蒸馏。

2.根据权利要求1所述的大模型动态知识蒸馏方法,其特征在于,所述计算所述学生模型的预测不确定值和区分能力包括:

将所述训练输入问答对输入学生模型进行预测,生成每个可能的输出类别的概率分布,该概率分布为当前轮的第二软标签;

通过概率方差量化所述第二软标签的离散性,得到预测不确定值;

设置第一方差阈值,若预测不确定值小于等于第一方差阈值,则判定当前所述学生模型的预测不确定值低;若预测不确定值大于第一方差阈值,则判定当前所述学生模型的预测不确定值高。

3.根据权利要求2所述的大模型动态知识蒸馏方法,其特征在于,所述计算所述学生模型的预测不确定值和区分能力还包括:

调取所述第一软标签,通过相对熵量化所述第一软标签与第二软标签的分布差异,得到区分能力值;

设置第一区分能力阈值,若区分能力值小于等于第一区分能力阈值,则判定当前所述学生模型区分能力强,若区分能力值大于第一区分能力阈值,则判定当前所述学生模型区分能力弱。

4.根据权利要求3所述的大模型动态知识蒸馏方法,其特征在于,所述根据所述预测不确定值和所述区分能力,动态调整蒸馏强度权重和蒸馏温度值,包括:

若当前所述学生模型的预测不确定值低,则增大蒸馏强度权重,若当前所述学生模型的预测不确定值高,则减小蒸馏强度权重;

若当前所述学

您可能关注的文档

文档评论(0)

aabbcc + 关注
实名认证
文档贡献者

若下载文档格式有问题,请咨询qq1643702686索取原版

1亿VIP精品文档

相关文档