一种视觉问答方法、系统、设备及可读存储介质.pdfVIP

  • 0
  • 0
  • 约2.82万字
  • 约 25页
  • 2023-05-31 发布于四川
  • 举报

一种视觉问答方法、系统、设备及可读存储介质.pdf

本申请属于计算机应用技术领域,并公开了一种视觉问答方法、系统、设备及可读存储介质,该方法包括:获取输入图像和问句文本,并分别提取图像特征和文本特征;利用图像特征,获得输入图像的词汇字典;结合词汇字典和图像特征,对文本特征进行降噪处理,得到降噪后的文本特征;对降噪后的文本特征和图像特征进行交互编码;从交互编码结果中,确定出问句答案和问句文本的错误提示。在本申请中,针对有问题的问句,通过以图中信息来对其进行降噪处理,仍然能够进行答案预测,具有较强鲁棒性。

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 115905591 A (43)申请公布日 2023.04.04 (21)申请号 202310147175.4 G06F 40/216 (2020.01)

文档评论(0)

1亿VIP精品文档

相关文档