对比学习与多模态任务实战:CLIP模型应用与优势.pdfVIP

  • 1
  • 0
  • 约5.26千字
  • 约 24页
  • 2026-06-11 发布于北京
  • 举报

对比学习与多模态任务实战:CLIP模型应用与优势.pdf

ContrastiveLanguag-magePre-Training

号训视觉

(利用文本的监督信号练一个迁移能力强的视模型)

用呢?图像

这家伙有什么用呢想象一个咱们训练图分类的场景

训练1000个类别,预测就是这1000个类别的概率,无法拓展

新标一劳

新增类别还得重新训练重新注太了,能不能永逸呢

这就是CLIP要解决的问题,预训练模型直接zero-shot

与前人工作对比

7方法

CLIP指出,1年就已经开始有这些了,但是没获得太多关注

似方

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档