- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN115599953B(45)授权公告日2025.07.04
(21)申请号202211183287.7GO6V10/74(2022.01)
(22)申请日2022.09.27(56)对比文件
(65)同一申请的已公布的文献号申请公布号CN115599953A
(43)申请公布日2023.01.13
(73)专利权人北京达佳互联信息技术有限公司地址100085北京市海淀区上地西路6号1
幢1层101D1-7
(72)发明人沈栋吴翔宇
CN113705187WO2022171067审查员胡武扬
A,2021.11.26
A1,2022.08.18
(74)专利代理机构北京润泽恒知识产权代理有
限公司11319专利代理师李娜
(51)Int.CI.
GO6F16/783(2019.01)
GO6V10/774(2022.01)权利要求书4页说明书16页附图3页
(54)发明名称
SI1
SI1
在所述第一视频特钲和所述第一文本特征中,确定出来源于同一第一视频样本的第二视频特征和第二文本特征,以及来源于不同第一视频样本的第三视频特征和第三文本特征;根插所述第二视频特征和所迷第二文本特征,确定出至少一个
确定出至少一个第二损失值;基于所述至少一个第一损失值和所述至少一个第二损失值,对所还待训练的文本特征提取模型的模型参数选行调整,得到已调练的文本特征提取模型
(57)摘要
115599953BCN本公开关于视频文本检索模型的训练方法、检索方法及相关设备,该训练方法包括:将第一视频样本输入预训练的视频特征提取模型,得到第一视频特征;将第一视频样本的描述文本数据输入待训练的文本特征提取模型,得到第一文本特征;在第一视频特征和第一文本特征中确定第二视频特征和第二文本特征以及第三视频特征和第三文本特征;根据第二视频特征和第二文本特征确定第一损失值,根据第三视频特征和第三文本特征确定第二损失值;基于第一损失值和第二损失值,调整待训练的文本特征提取模型的模型参数,得到已训练的文本特征提取模型;将预训练的视频特征提取模型和已训练的文本特征
115599953B
CN
CN115599953B权利要求书1/4页
2
1.一种视频文本检索模型的训练方法,其特征在于,包括如下步骤:
获取第一视频样本,以及所述第一视频样本对应的描述文本数据;
将所述第一视频样本输入预训练的视频特征提取模型,得到第一视频特征;
将所述第一视频样本对应的描述文本数据输入待训练的文本特征提取模型,得到第一文本特征;
在所述第一视频特征和所述第一文本特征中,确定出来源于同一第一视频样本的第二视频特征和第二文本特征,以及来源于不同第一视频样本的第三视频特征和第三文本特征;根据所述第二视频特征和所述第二文本特征,确定出至少一个第一损失值,根据所述第三视频特征和所述第三文本特征,确定出至少一个第二损失值;基于所述至少一个第一损失值和所述至少一个第二损失值,对所述待训练的文本特征提取模型的模型参数进行调整,得到已训练的文本特征提取模型;
将所述预训练的视频特征提取模型和所述已训练的文本特征提取模型作为视频文本检索模型,所述视频文本检索模型用于基于视频检索数据检索出目标文本数据,基于文本检索数据检索出目标视频数据;
在所述将所述第一视频样本输入预训练的视频特征提取模型,得到第一视频特征的步骤前,所述方法还包括:
获取第二视频样本分别对应的图像数据、内容文本数据和预设分类标签;
将所述图像数据和所述内容文本数据输入待训练的视频特征提取模型,得到预训练中的视频特征;
基于由所述预训练中的视频特征和所述预设分类标签对应的第三损失值,对所述待训练的视频特征提取模型的模型参数进行调整,得到预训练的视频特征提取模型。
2.根据权利要求1所述的方法,其特征在于,所述至少一个第一损失值包括第一视频文本损失值和第一文本视频损失值,所述根据所
您可能关注的文档
- WO2025140742A1 一种模组通信方法、装置、电子设备及存储介质 (天翼物联科技有限公司).docx
- WO2025140749A1 一种电化学机械抛光组合物、用途及方法 (昂士特科技(深圳)有限公司).docx
- WO2025141348A1 一种传输协议切换方法、设备及存储介质 (云智能资产控股(新加坡)私人股份有限公司).docx
- WO2025141423A1 运维任务处理方法、存储介质和电子设备 (云智能资产控股(新加坡)私人股份有限公司).docx
- WO2025141455A1 不粘材料、不粘涂层、炊具和制造炊具的方法 (武汉苏泊尔炊具有限公司).docx
- WO2025141485A1 虚拟机热迁移方法、物理主机和存储介质 (云智能资产控股(新加坡)私人股份有限公司).docx
- WO2025141486A1 一种故障处理方法、设备及存储介质 (云智能资产控股(新加坡)私人股份有限公司).docx
- WO2025141493A1 日志存储方法、数据库系统、服务器及存储介质 (云智能资产控股(新加坡)私人股份有限公司).docx
- CN115019793B 基于协同纠错的唤醒方法、装置及系统、介质、设备 (四川虹美智能科技有限公司).docx
- CN115038638B 履带式车辆、运行轨道总成、车辆系统和在运行轨道总成上行驶的方法 (磁履有限责任公司).docx
最近下载
- 肿瘤科护理一科一品成果.pptx VIP
- 华为DSTE战略管理体系完整版1.pptx VIP
- 喷锚支护计算书.doc VIP
- 2025新修订《治安管理处罚法》应知应会100题(含答案+解析).pdf
- 新外研版必修三单词默写表(附参考答案).docx VIP
- 《制冷和空调设备基础与技能》单元2 全封闭活塞式制冷压缩机的拆卸、检测与维修 教学课件.pptx VIP
- 《万以内数的认识:整理和复习》教学设计-2025-2026学年人教版(新教材)小学数学二年级下册.docx
- JHD系列商业卫星用56Gbps矩形高速IO连接器.pdf VIP
- EtherCAT总线在运动控制系统的应用.ppt VIP
- 2026届湖南省衡阳市第一中学物理高二上期末监测试题含解析.doc
原创力文档


文档评论(0)