- 1、本文档共23页,其中可免费阅读22页,需付费10金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本申请实施例属于深度学习技术领域,涉及一种应用于BERT模型的蒸馏方法、装置、计算机设备及存储介质。本申请提供的应用于BERT模型的蒸馏方法,由于精简BERT模型保留了与原始BERT模型相同的模型结构,差异是层数的不同,使得代码改动量较小,而且大模型与小模型的预测代码是一致的,可以复用原代码,使得模型在蒸馏的过程中,无需平衡各个loss参数的权重,进而降低深度模型蒸馏方法的困难程度,同时,训练精简BERT模型各个阶段的任务均保持一致性,使得精简BERT模型收敛得更加稳定。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112418291 A
(43)申请公布日 2021.02.26
(21)申请号 202011288877.7
(22)申请日 2020.11.17
(71)申请人 平安科技(深圳)有限公司
您可能关注的文档
- 一种开放式食品冷藏柜的底部可扩展结构.pdf
- 基于mysql和java的检索库管理及数据检索方法.pdf
- 基于Kubernetes的分布式系统的资源权限管理系统及方法.pdf
- 预应力钢筒混凝土管防堵塞装置.pdf
- 芯片装置.pdf
- 一种自动除尘裁断机.pdf
- 一种基于跨季蓄冷的水冷粮食贮藏系统及工作方法.pdf
- 一种燃烧器的油箱清洗除油设备.pdf
- 一种工业污水的定时抽样检测设备.pdf
- 一种模块化铝板墙线盒的快速安装结构.pdf
- 五年级全一册信息技术 2.5 《算法验证与实现》 人教版.pptx
- 3.4加密与解密 课件-江苏省2025年1月普通高中学业水平合格性考试信息技术复习.pptx
- 浙教版(2023)四上信息科技 第05课 数据获取 课件.pptx
- 3.3信息系统的数据输入 课件-江苏省2025年1月普通高中学业水平合格性考试信息技术复习.pptx
- 5.2信息社会的法律与法规 学案-江苏省2025年1月普通高中学业水平合格性考试信息技术复习.doc
- 义务教育版(2024)三年级信息科技 第23课 分解描述问题 课件.pptx
- 5.2信息社会的法律与法规 课件-江苏省2025年1月普通高中学业水平合格性考试信息技术复习.pptx
- 8.3.1 金属矿物、铁的冶炼 课件(共19张PPT 内嵌视频) (2024年)化学人教版九年级下册.pptx
- 9.1增强安全意识 课件(共22张PPT)+内嵌视频.pptx
- 4 田家四季歌 课件(18张PPT).ppt
文档评论(0)