CN119647530A 基于模型量化的任务处理方法、装置、设备及存储介质 (杭州海康威视数字技术股份有限公司).docxVIP

  • 2
  • 0
  • 约2.87万字
  • 约 36页
  • 2026-06-05 发布于山西
  • 举报

CN119647530A 基于模型量化的任务处理方法、装置、设备及存储介质 (杭州海康威视数字技术股份有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119647530A

(43)申请公布日2025.03.18

(21)申请号202411708331.0

(22)申请日2022.09.27

(62)分案原申请数据

202211186183.12022.09.27

(71)申请人杭州海康威视数字技术股份有限公司

地址310051浙江省杭州市滨江区阡陌路

555号

(72)发明人蓝朝祥李哲暘张凯

(74)专利代理机构北京博思佳知识产权代理有限公司11415

专利代理师杨春香

(51)Int.Cl.

G06N3/048(2023.01)

G06N5/04(2023.01)

权利要求书2页说明书14页附图3页

(54)发明名称

基于模型量化的任务处理方法、装置、设备

及存储介质

(57)摘要

CN119647530A本申请提供一种基于模型量化的任务处理方法、装置、设备及存储介质,该基于模型量化的任务处理方法包括:依据Transformer模型中优化单元的第一量化输出和第一浮点输出之间的差异,对优化单元的权重量化系数和激活量化系数进行更新;依据优化单元的第二量化输出和第二浮点输出之间的差异,对优化单元的权重量化增量进行更新;依据目标量化系数对优化单元的权重参数进行量化,并依据目标权重量化增量确定优化单元的权重

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档