摘要
摘要
视频问答任务旨在让机器具备理解视频内容、推理时序信息和基于自然语言问题生成
准确答案的能力。针对现有视频问答算法存在的跨模态特征交互不足、复杂视频场景适应
性差、视频的全局语义信息利用不充分以及跨模态语义不一致等问题,提出基于多头交叉
注意力的表示增强视频问答算法,论文的主要工作如下:
(1)针对现有视频问答算法存在跨模态特征交互不充分的问题,构建引入多头交叉注
意力的视频级与片段级特征融合的视频问答算法(MHCA)。该算法在
您可能关注的文档
- 李鸿章书法研究.pdf
- 零维发光铟基卤化物的构筑及其应用研究.pdf
- 基于GCN的Web+API分类研究.pdf
- 协同大位阻镍钯催化剂调控乙烯聚合及与极性单体共聚合.pdf
- 基于二元阵列矢量光场的焦场阵列调控.pdf
- 带储能并网风电场无功控制及电压稳定性研究.pdf
- 顾从德《集古印谱》研究.pdf
- 手工艺题材纪录片的共情叙事研究--兼论毕业作品《器以载道》的创作.pdf
- 基于运动想象的脑控轮椅系统研究.pdf
- 龚端礼《五服图解》研究.pdf
- (正式版)DB21∕T 3337-2020 《野生草本植物引种技术规程》.docx
- CN120004263A 一种阴离子插层的石墨催化剂及其制备方法和应用 (电子科技大学).pdf
- CN120003651A 一种浮船坞海上分段装船方法 (中国船舶集团青岛北海造船有限公司).pdf
- (正式版)DB35T 2297-2026 废电路板综合利用污染控制技术导则.docx
- (正式版)DB41 2557-2023 《化学肥料工业大气污染物排放标准》.docx
- (正式版)DB41∕T 903-2014 《河南省林业重点工程营造林作业设计编制规范》.docx
- (正式版)DB41∕T 907-2014 《卫星定位汽车行驶记录仪通用技术规范》.docx
- (正式版)DB21∕T 3390.1-2021 《规模化养鸡场管理技术规范 第1部分:防疫》.docx
- (正式版)DB21∕T 3392.2-2021 《动物无害化处理技术规范 第2部分:屠宰场》.docx
- (正式版)DB21∕T 3341-2020 《辽西景观油松造型技术规程》.docx
原创力文档

文档评论(0)