- 0
- 0
- 约1.26万字
- 约 17页
- 2026-07-05 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119832535A
(43)申请公布日2025.04.15
(21)申请号202411900860.0
(22)申请日2024.12.23
(71)申请人重庆邮电大学
地址400065重庆市南岸区崇文路2号
(72)发明人黄胜陈洲
(51)Int.Cl.
G06V20/62(2022.01)
G06V30/186(2022.01)
G06V30/19(2022.01)
G06V10/82(2022.01)
G06N3/045(2023.01)
G06N3/0499(2023.01)
G06N3/08(2023.01)
G06V10/80(2022.01)
权利要求书2页说明书6页附图2页
(54)发明名称
一种基于多模态特征融合的视觉问答方法
及其模型
(57)摘要
CN119832535A本发明提出一种多模态特征融合的视觉问答方法,通过生成不同分辨率的图像,多尺度信息挖掘模块能够有效地提取不同尺度下的图像特征,从而提升图像理解的精度并通过多模态特征引导融合策略,将图像和文本特征高效结合,利用自注意力和交叉机制在特征层次深度交互,生成具有语义与视觉信息融合的特征表示,利用多模态特征融合后之后的数据特征,通过全连接神经网络和文本输入到大模型中获
您可能关注的文档
- CN119832361A 基于图像风格迁移的广告设计辅助方法及系统 (杭州次元宇宙文化传播有限公司).docx
- CN119832378A 基于Transformer和CNN融合的小病灶分割和特征学习方法 (深圳技术大学).docx
- CN119832388A 一种混料均匀度确定方法及混料均匀度检测系统 (万华化学集团股份有限公司).docx
- CN119832391A 基于可容错目标定位的视觉导航方法、系统及介质 (山东大学).docx
- CN119832391B 基于可容错目标定位的视觉导航方法、系统及介质 (山东大学).docx
- CN119832393A 用于遥感变化检测的噪声标签鲁棒学习方法、系统和设备 (湖南大学).docx
- CN119832394A 数据分流装置、具有该装置的控制系统及其配置方法 (北京图森智途科技有限公司).docx
- CN119832395A 汽车领域can总线数据的图像识别与分析方法及系统 (中汽数据(天津)有限公司).docx
- CN119832406A 基于多尺度特征融合及高校上采样算法的声呐图像水下检测方法及系统 (南京理工大学).docx
- CN119832436A 基于无人机遥感的森林虫害智能监测方法 (深圳恒升应急科技有限公司).docx
- 绵阳市平武县2025届数学四年级第二学期期末联考试题含解析.docx
- 绵阳市三台县2025届三年级数学第二学期期末模拟试题(含答案).docx
- 绵阳市三台县2025届四年级数学下学期期中模拟试题含解析.docx
- 绵阳市三台县2025届四年级数学下学期期末模拟试题(含答案解析).docx
- 绵阳市三台县2025届四年级数学下学期期末模拟试题(含答案).docx
- 绵阳市三台县2025届四年级数学第二学期期中模拟试题含答案.docx
- 绵阳市三台县2025届四年级数学第一学期阶段模拟试题(含答案).docx
- 绵阳市三台县2025届四年级数学第二学期期中模拟试题含解析.docx
- 绵阳市三台县2025届四年级数学第二学期期中模拟试题(含答案解析).docx
- 绵阳市三台县2025届四年级数学第一学期期中模拟试题含答案解析.docx
最近下载
- 公司治理学(李维安)公司治理资料整理.doc VIP
- 中国儿童维生素D营养相关临床问题实践指南.pptx VIP
- 2026湖北交投鄂西高速公路运营管理有限公司招聘笔试备考题库及答案解析.docx VIP
- 《种群的增长模型》.pdf VIP
- 2026年江西九江市中考数学试卷及答案.docx VIP
- 中国儿童维生素A、维生素D临床应用专家共识(2024).pptx VIP
- 中国儿童维生素A、维生素D临床应用专家共识(2024).pptx VIP
- T /FJZYC 15—2025 灵芝林下茶枝屑菌包栽培技术规程.pdf VIP
- 中国分裂情感性障碍防治指南(2025).docx VIP
- ASTM A213_A213M-25 中文版(锅炉、过热器和换热器用无缝铁素体和奥氏体不锈钢管标准).docx VIP
原创力文档

文档评论(0)