基于多模态数据融合的视觉问答研究.docx

基于多模态数据融合的视觉问答研究.docx

毕业设计(论文)

PAGE

1-

毕业设计(论文)报告

题目:

基于多模态数据融合的视觉问答研究

学号:

姓名:

学院:

专业:

指导教师:

起止日期:

基于多模态数据融合的视觉问答研究

摘要:视觉问答(VisualQuestionAnswering,VQA)是计算机视觉和自然语言处理领域的一个交叉性研究课题。近年来,随着深度学习技术的发展,基于多模态数据融合的视觉问答方法取得了显著的进展。本文针对视觉问答中存在的多模态信息融合和语义理解问题,提出了一种基于多模态数据融合的视觉问答方法。该方法首先利用卷积神经网络(CNN)提取图像特征,然

文档评论(0)

1亿VIP精品文档

相关文档