- 2
- 0
- 约4.09万字
- 约 26页
- 2023-05-17 发布于四川
- 举报
本发明公开了一种利用位置信息优化的视觉问答方法。所述方法包括以下步骤:收集训练数据,包括图片和与给定图片相关的问题;对输入的问题做前处理;对输入的图片做前处理;进行多头位置自注意力操作来得到问题中单词的融合特征向量:进行位置自注意力操作,同时利用位置联合注意力机制对视觉模态和语言模态进行融合,得到图片中的物体的融合特征向量;将物体的融合特征向量和单词的融合特征向量压缩后进行融合;构成视觉问答模型,预测问题答案,计算和真值之间差别,并通过反向传播来训练视觉问答模型,向训练后的视觉问答模型输入数据即
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114818739 A
(43)申请公布日 2022.07.29
(21)申请号 202210327078.9
(22)申请日 2022.03.30
(71)申请人 华南理工大学
地址 510640
您可能关注的文档
最近下载
- 2026高中数学复习-专题22 数列的概念与表示(九大题型+模拟精练)(解析版).pdf VIP
- 中国成人体重管理指南2025解读.pptx
- TB_T 3355-2023 轨道检测 轨道几何状态动态检测.pdf VIP
- 中学历史教案培养学生历史思维与分析能力的教学策略.pptx VIP
- SMI 地震波形指示反演软件.pdf VIP
- 广东省深圳市龙华区2022-2023学年七年级下册数学期末试卷 .pdf VIP
- 三一重工100T吊车拆装作业指导.docx VIP
- 第五单元达标练习(单元测试)2025-2026学年二年级语文下册统编版(含答案).docx VIP
- 2025年国家开放大学(电大)《数据分析与统计》期末考试备考题库及答案解析.docx VIP
- 2023年湖南卷高考化学真题试卷.docx
原创力文档

文档评论(0)