CN119762485A 基于多模态大模型的表观缺陷检测方法及系统 (武汉大学).docxVIP

  • 2
  • 0
  • 约1.52万字
  • 约 23页
  • 2026-06-21 发布于山西
  • 举报

CN119762485A 基于多模态大模型的表观缺陷检测方法及系统 (武汉大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119762485A

(43)申请公布日2025.04.04

(21)申请号202510258419.5

(22)申请日2025.03.06

(71)申请人武汉大学

地址430072湖北省武汉市武昌区八一路

299号

(72)发明人邹勤赵守玺毛庆洲余招勇李清泉

(74)专利代理机构武汉科皓知识产权代理事务所(特殊普通合伙)42222

专利代理师齐晨涵

(51)Int.Cl.

G06T7/00(2017.01)

G06V10/80(2022.01)

G06V10/82(2022.01)

G06N3/0455(2023.01)

G06N3/08(2023.01)

权利要求书2页说明书9页附图1页

(54)发明名称

基于多模态大模型的表观缺陷检测方法及

系统

(57)摘要

CN119762485A本发明公开了一种基于多模态大模型的表观缺陷检测方法及系统。首先,设计提示词,利用GPT一4V自动标注缺陷图像来构建缺陷图像一掩膜一文字描述数据集;其次,利用此数据集微调预训练的大语言骨干网络,使其能更好地理解缺陷检测任务;然后,针对编码器各层视觉特征,设计了一种多视觉尺度token组机制,再利用轻量级掩膜解码器输出缺陷检测结果;最后,结合大语言骨干网

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档