基于深度混合神经网络的视频检索方法研究.pdfVIP

下载本文档

0
0
约8.92万字
约 75页
2025-07-08 发布于广东
举报
版权申诉

基于深度混合神经网络的视频检索方法研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要

随着技术的到来，在日常生活中每天都会有大量的视频数据生成并上传到

互联网中，这给目标视频的搜索带来一定的困难。如何在短时间内从大规模的视

频数据库中高效准确地搜索出人们所需的目标视频已成为亟待解决的问题。

现大多数的视频检索方法往往会存在一些不足之处。它们或忽略了视频包含

的时间信息，使得在提取视频特征时存在时序信息特征不明显的问题；或将视频

的各帧都同等看待，没有充分考虑到各视频帧在表现视频内容时所起的作用是不

同的，从而造成学习到的视频特征包含着大量的重复性信息。本文针对以上的问

题，主要做了以下的工作，概括如下：

第一，本文将卷积神经网络和循环神经网络相结合组成一种端到端的深度混

合神经网络结构。该结构不仅能够提取到视频的空间特征，还能有效学习视频时

序序列中的长期依赖关系。但考虑到单向循环神经网络捕捉到的视频时间信息不

全面，为此本文使用了双向循环神经网络来从视频帧中提取到双向的时间依赖性

信息，从而可以有效提升深度混合神经网络学习视频数据时序特征的能力，这对

理解整个视频内容具有重要意义。

第二，在深度混合神经网络结构中引入注意力机制即SENet网络，用其得到

不同视频帧相对应的特征通道的权重信息，进而提升对现阶段任务有益的通道特

征并赋予较大权重，对于无用的通道特征加以抑制并赋予较小权重，从而能够有

效解决视频特征中存在的信息过载的问题。

第三，将哈希学习技术整合到网络结构中，使提取到的视频高维特征编码为

紧凑简洁的二值哈希码，这不仅减少了网络存储空间的消耗还能在一定程度上提

升了视频检索性能。同时通过设计网络的目标函数，以此赋予视频二进制哈希码

的分类能力，增强哈希码的紧凑性。

第四，本文将所提方法与其它视频检索方法在已有的视频数据集上进行对比

实验，实验结果表明本文提出的方法具有一定的优越性。

第五，依据本文提出的方法设计并实现了一个视频检索系统，该系统在一定

程度上具有较好的视频检索效果。

关键词：视频检索；深度混合神经网络；注意力机制；特征提取；哈希学习

Abstract

Alongwiththecomingof5Gtechnology,agreatdealofvideodataisproduced

anduploadedtotheInterneteverydayindailylives,whichbringscertaindifficultiesto

thesearchoftargetvideos.Howtoefficientlyandaccuratelyretrievalforthedesired

targetvideofromalarge-scalevideodatabaseatshortnoticehasbecomeapressing

problem.

Mostofthecurrentvideoretrievalmethodshavesomeshortcomings.Theyeither

ignorethetemporalinformationcontainedinthevideo,resultingintheproblemof

uncleartemporalinformationfeatureswhenextractingvideofeatures;Ortreateach

frameofthevideoequallywithoutfullyconsideringthedifferentrolesplayedby

differentvideoframesinexpressingvideocontent,resultingininformationredundancy

issuesintheextractedvideofeatures.Inresponse

您可能关注的文档

文档评论（0）

n1u1 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

基于深度混合神经网络的视频检索方法研究.pdfVIP