CN119629360A 一种视觉可控的编码端深度学习视频压缩控制方法 (北京理工大学).docxVIP

  • 2
  • 0
  • 约1.18万字
  • 约 18页
  • 2026-05-31 发布于山西
  • 举报

CN119629360A 一种视觉可控的编码端深度学习视频压缩控制方法 (北京理工大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119629360A

(43)申请公布日2025.03.14

(21)申请号202411622248.1

(22)申请日2025.02.14

(71)申请人北京理工大学

地址100081北京市海淀区中关村南大街5

(72)发明人葛兴统耿晶

(74)专利代理机构北京盛广信合知识产权代理

有限公司16117

专利代理师王永泽

(51)Int.Cl.

H04N19/42(2014.01)

H04N19/44(2014.01)

H04N19/146(2014.01)

H04N19/14(2014.01)

H04N19/177(2014.01)

H04N19/48(2014.01)

G06N3/0464(2023.01)

权利要求书2页说明书6页附图2页

(54)发明名称

一种视觉可控的编码端深度学习视频压缩

控制方法

(57)摘要

CN119629360A本发明公开了一种视觉可控的编码端深度学习视频压缩控制方法,包括:预训练针对人眼视觉优化的深度学习编解码器,并冻结模型参数,形成编码端;在编码端加入编码模式预测策略,针对下游任务进行训练优化,获得优化后的编码模式预测模型;对编码模式预测模型进行模型训练,训练完成后引入编码帧结构预测模型,面向下游

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档