一种基于自驱动孪生采样和推理的视频问答方法 .pdf

下载文档

1
0
约8.85千字
约 16页
2024-12-04 发布于山东
举报
版权申诉
保障服务

一种基于自驱动孪生采样和推理的视频问答方法 .pdf

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局

(12)发明专利说明书

(10)申请公布号CN114218439A

(43)申请公布日2022.03.22

(21)申请号CN202111553547.0

(22)申请日2021.12.17

(71)申请人中山大学

地址510275广东省广州市海珠区新港西路135号

(72)发明人余伟江卢宇彤李孟非陈志广

(74)专利代理机构44367深圳市创富知识产权代理有限公司

代理人高冰

(51)Int.CI

G06F16/783

G06F16/78

G06F16/75

G06F16/71

G06F16/332

G06V20/40

G06V10/764

G06K9/62

G06N5/04

权利要求说明书说明书幅图

(54)发明名称

一种基于自驱动孪生采样和推理的

视频问答方法

(57)摘要

本发明公开了一种基于自驱动孪生

采样和推理的视频问答方法，所述方法包

括视频段采样、特征提取与推理策略，其

中，所述视频段采样通过稀疏采样得到基

准视频段以及通过孪生采样获得孪生视频

段；所述特征提取通过一视频编码器，一

文本编码器和一多模态将多个视频段‑文

本对编码成相应的语义特征表示；所述推

理策略通过使用孪生知识生成模块为视频

段生成提炼后的知识标签，并使用孪生知

识推理模块将这个标签传播给其所有孪生

样本并进行融合。本发明有益效果在于，

提出了此基于自驱动孪生采样和推理的框

架，并将其用于提取相同视频的不同视频

段中的上下文语义信息，用于增强网络的

学习效果。

法律状态

法律状态公告日法律状态信息法律状态

2022-03-22公开发明专利申请公布

实质审查的生效IPC(主分

类):G06F16/783专利申请

2022-04-08实质审查的生效

号:2021115535470申请

日

权利要求说明书

1.一种基于自驱动孪生采样和推理的视频问答方法,其特征在于,所述方法包括视频

段采样、特征提取与推理策略,其中,所述视频段采样通过稀疏采样得到基准视频段

以及通过孪生采样获得孪生视频段;所述特征提取通过一视频编码器,一文本编码器

和一多模态将多个视频段-文本对编码成相应的语义特征表示;所述推理策略通过使

用孪生知识生成模块为视频段生成提炼后的知识标签,并使用孪生知识推理模块将

这个标签传播给其所有孪生样本并进行融合。

2.根据权利要求1所述的基于自驱动孪生采样和推理的视频问答方法,其特征在于,

在所述视频段采样中,分别使用稀疏采样和孪生采样获得基准段和孪生段,并使用特

征提取模型分别提取出这些视频段的特征;在所述特征提取中,用孪生知识生成模块,

根据基准段和孪生段的特征,计算出视频内部的上下文特征;在所述推理策略中,使用

孪生知识推理模块,根据所述上下文特征,自适应地为视频段生成提炼后的软标签。

3.根据权利要求1或2所述的基于自驱动孪生采样和推理的视频问答方法,其特征在

于,所述孪生采样包括通过对视频样本F进行稀疏采样得到长度为B帧的视频段样

本;其中,F的长度大于B;以随机的方式

您可能关注的文档

文档评论（0）

1637142147337d1 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

一种基于自驱动孪生采样和推理的视频问答方法 .pdf