- 7
- 0
- 约2.76万字
- 约 22页
- 2023-06-22 发布于四川
- 举报
本公开提供了一种视觉问答模型训练及视觉问答方法、装置、设备及介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术,可用于遥感影像场景,包括:获取目标图像的训练集数据;目标图像的训练集数据包括目标图像、目标图像文本以及目标图像非视觉数据;对目标图像进行图像特征提取,得到目标图像特征;对目标图像文本进行文本特征提取,得到目标文本特征;对目标图像非视觉数据进行非视觉特征提取,得到目标非视觉特征;对目标图像特征、目标文本特征以及目标非视觉特征进行融合,得到目标融合特征;根据目标融合特征对视觉问答
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113392253 A
(43)申请公布日 2021.09.14
(21)申请号 202110719508.7 G06K 9/46 (2006.01)
原创力文档

文档评论(0)