- 1
- 0
- 约2.04万字
- 约 29页
- 2026-06-15 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119723275A
(43)申请公布日2025.03.28
(21)申请号202510246540.6
(22)申请日2025.03.04
(71)申请人上海旺脉信息科技集团有限公司
地址201712上海市青浦区天一路568号2
号楼2层2042号
(72)发明人吴超
(74)专利代理机构上海洞见未来专利代理有限
公司31467
专利代理师刘宏博
(51)Int.Cl.
G06V10/80(2022.01)
G06V10/82(2022.01)
G06N3/0464(2023.01)
G06N3/084(2023.01)
G06N3/0895(2023.01)
权利要求书3页说明书12页附图1页
(54)发明名称
一种基于多模态大模型的素材识别方法
(57)摘要
CN119723275A本发明公开了一种基于多模态大模型的素材识别方法,具体涉及数据处理技术领域;通过将广告素材的图像数据和关联文本数据输入多模态大模型,进行初步预处理和特征提取;利用卷积神经网络和自然语言处理技术,分别提取图像和文本的视觉特征与语义特征,并通过多模态对比学习策略,优化图像与文本特征的融合效果;通过对比损失函数验证特征对齐情况,并结合双路径微调机制与多标签分类监督,提升模型的识别
您可能关注的文档
- CN119722876A 图像处理方法、装置、电子设备及存储介质 (北京字跳网络技术有限公司).docx
- CN119722902A 一种基于光线追踪的实时渲染优化方法 (深圳市瑞云科技股份有限公司).docx
- CN119722919A 一种基于三维高斯溅射技术的动态人体建模方法 (广东工业大学).docx
- CN119722933A 基于三维激光点云的农村能源设施快速建模方法 (国网湖北省电力有限公司电力科学研究院).docx
- CN119722943A 一种基于三维软件的集装箱模型构建方法 (万汇互联(深圳)科技有限公司).docx
- CN119722960A 场景的构建方法及装置、电子设备和存储介质 (苏州元脑智能科技有限公司).docx
- CN119722961A 地下建筑物高空间分辨率三维形貌的双目视觉重建方法 (中国电建集团西北勘测设计研究院有限公司).docx
- CN119722963A 虚拟场景的生成方法、装置、计算机设备及存储介质 (北京通用人工智能研究院).docx
- CN119722974A 一种三维地图构建方法、装置、计算机设备及存储介质 (浙江师范大学).docx
- CN119722974B 一种三维地图构建方法、装置、计算机设备及存储介质 (浙江师范大学).docx
最近下载
- 《二维动态图形设计基础》第二章 动态图形设计的准备工作.pptx VIP
- 酞菁-二氧化硅荧光纳米粒子的合成.pdf VIP
- 2025年中级导游等级考试(导游知识专题)强化练习题及答案(陕西).docx VIP
- 地基剪切模量对列车引起的动应力的影响.pdf VIP
- 外研版小学英语语法总复习知识点归纳PDF打印版.pdf VIP
- 《二维动态图形设计基础》第一章 动态图形设计概述.pptx VIP
- 逆矩阵的特征向量.pdf VIP
- (2026年)痛风石的防治健康宣教PPT课件.pptx VIP
- 世界气象组织建议的高温热浪的标准.pdf VIP
- 2025江苏中职职教高考-化工类-讲义知识考点复习资料.pdf VIP
原创力文档

文档评论(0)