一种问题理解导向的视频问答方法及系统.pdfVIP

  • 2
  • 0
  • 约1.58万字
  • 约 13页
  • 2023-09-30 发布于四川
  • 举报

一种问题理解导向的视频问答方法及系统.pdf

本发明属于多媒体问答技术领域,提出了一种问题理解导向的视频问答方法及系统,包括:对视频帧进行特征提取得到外观特征、对象特征和动作特征;对问题进行多层编码后获得单词级问题表示和全局问题表示;利用全局问题表示和视频帧的特征表示作为指导,将对象特征整合到外观中,得到每个视频帧的对象增强的外观特征;将单词级问题表示分别与对象增强的外观特征以及动作特征进行拼接后输入到模型中,得到外观增强的单词级问题表示以及动作增强的单词级问题表示;将外观增强的单词级问题表示以及动作增强的单词级问题表示进行加权融合后输入答

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116824461 A (43)申请公布日 2023.09.29 (21)申请号 202311098884.4 G06N 3/0464 (2023.01)

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档