- 1
- 0
- 约4.44万字
- 约 65页
- 2026-01-09 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114078195B(45)授权公告日2025.07.01
(21)申请号202010787442.0
(22)申请日2020.08.07
(65)同一申请的已公布的文献号申请公布号CN114078195A
(43)申请公布日2022.02.22
(73)专利权人华为技术有限公司
地址518129广东省深圳市龙岗区坂田华
为总部办公楼
(72)发明人周彧聪钟钊
(74)专利代理机构北京龙双利达知识产权代理有限公司11329
专利代理师王龙华王君
(51)Int.CI.
GO6V10/764(2022.01)
GO6V10/82(2022.01)
GO6N3/0464(2023.01)
GO6N3/084(2023.01)
GO6N3/0985(2023.01)
(56)对比文件
NaverAILab.ADAMP:SLOWINGDOWNTHESLOWDOWNFORMOMENTUMOPTIMIZERSON
SCALE-INVARIANTWEIGHTS.ICLR.2020,第1页-第27页.
HaoLi.RETHINKINGTHEHYPERPARAMETERS
FORFINE-TUNING.ICLR.2024,第1页-第20页.审查员程剑华
权利要求书4页说明书25页附图5页
(54)发明名称
分类模型的训练方法、超参数的搜索方法以
及装置
(57)摘要
CN114078195B本申请涉及人工智能技术领域公开了一种分类模型的训练方法、超参数的搜索方法以及装置,训练方法包括获取待训练分类模型的目标超参数,所述目标超参数用于控制所述待训练分类模型的梯度更新步长,所述待训练分类模型包括缩放不变性线性层,所述缩放不变性线性层使得所述待训练分类模型的权重参数乘以任意缩放系数时输出的预测分类结果保持不变;根据所述目标超参数与目标训练方式对所述待训练分类模型的权重参数进行更新,得到训练后的分类模型,所述目标训练方式使得所述待训练分类模型更新前与更新后的权重参数的模长相同。基于本
CN114078195B
500
获取待训练分类模型的目标超参数,所述目标超参数用于控制待
训练分类模型的梯度更新步长,所述待训练分类模型包括缩放不
变线性层,所述缩放线性不变性线性层使得所述待分类模型的权
重乘以任意缩放系数时输出的预测分类结果保持不变
根据所述目标超参数与目标训练方式对所述待训练分类模型的权重参数进行更新,得到训练后的分类模型,所述目标训练方式使得所述待训练分类模型更新前与更新后的权重参数的模长相同
S510
S520
CN114078195B权利要求书1/4页
2
1.一种分类模型的训练方法,其特征在于,包括:
获取待训练分类模型的目标超参数,所述目标超参数为等效学习率,所述目标超参数用于控制所述待训练分类模型的梯度更新步长,所述待训练分类模型包括缩放不变性线性层,所述缩放不变性线性层使得所述待训练分类模型的权重参数乘以任意缩放系数时输出的预测分类结果保持不变;
根据所述目标超参数与目标训练方式对所述待训练分类模型的权重参数进行更新,得到训练后的分类模型,所述目标训练方式使得所述待训练分类模型更新前与更新后的权重参数的模长相同。
2.如权利要求1所述的训练方法,其特征在于,所述训练后的分类模型的权重参数是根据所述目标超参数和所述目标训练方式通过反向传播算法多次迭代更新得到的。
3.如权利要求1或2所述的训练方法,其特征在于,所述缩放不变性线性层根据以下公式得到所述预测分类结果:
其中,Y表示第i次迭代更新的权重参数对应的预测分类结果;W表示所述第i次迭代更新的权重参数;X表示待分类特征;S表示尺度常数。
4.如权利要求1或2所述的训练方法,其特征在于,所述目标训练方式包括:
通过以下公式对所述更新后的权重参数进行处理,使得所述待训练分类模型更新前与更新后的权重参数的模长相同:
其中,W:+1表示第i+1次迭代更新的权重参数;W表示第i次迭代更新的权重参数;Norm。表示所述待训练分类模型的初始权重模长。
5.一种超参数的搜索方法,其特征在于,包括:
获取目标超参数的候选值,所述目标超参数为等效学习率,所述目标超参数用于控制待训练分类模型的梯度更新步长,所述待训练分类模型包括缩放不变性线性层,所述缩放不变性线性
您可能关注的文档
- CN113404595B 燃气涡轮发动机及其操作方法 (通用电气公司).docx
- CN113448267B 用于制备食物的厨房系统及其操作方法和计算机程序产品 (德国福维克控股公司).docx
- CN113449548B 更新物体识别模型的方法和装置 (华为技术有限公司).docx
- CN113473106B 图像传输方法、图像显示及处理设备、及图像传输系统 (青岛小鸟看看科技有限公司).docx
- CN113488465B 半导体器件结构、半导体器件及其形成方法 (台湾积体电路制造股份有限公司).docx
- CN113489486B 片内晶振校准电路及校准方法 (青芯半导体科技(上海)有限公司).docx
- CN113525385B 一种车辆行程能耗的预测方法及装置 (株式会社日立制作所).docx
- CN113534543B 一种灌晶系统及灌晶方法 (麒麟电子(深圳)有限公司).docx
- CN113661249B 用于分离无细胞dna的组合物和方法 (夸登特健康公司).docx
- CN113687811B 一种音频信号输出控制方法及显示设备 (Vidaa(荷兰)国际控股有限公司).docx
- 三年级下册语文1-8单元默写通关训练(含答案)(2).docx
- 2026年及未来5年市场数据中国金属钒市场发展规划及投资战略可行性预测报告.docx
- 2026年及未来5年市场数据中国金属工艺品行业全景调研及投资可行性报告.docx
- 2026年及未来5年市场数据中国金属家具市场分析及投资战略研究预测可行性报告.docx
- 2026年及未来5年市场数据中国金属膜电阻器行业市场需求预测与投资战略规划分析报告.docx
- 2026年及未来5年市场数据中国金银花行业市场发展战略分析及投资前景专项预测报告.docx
- 2026年及未来5年市场数据中国金银花行业市场研究及投资战略预测报告.docx
- 2026年及未来5年市场数据中国抗氧化剂市场专项调查分析及投资前景预测报告.docx
- 2026年及未来5年市场数据中国救护车市场运行格局及投资战略研究报告.docx
- 2026年及未来5年市场数据中国精细化工行业发展前景预测及投资分析报告.docx
原创力文档

文档评论(0)