ContrastiveLanguage-ImagePre-Training
(利用文本的监督信号训练一个迁移能力强的视觉模型)
这家伙有什么用呢?想象一个咱们训练图像分类的场景
训练1000个类别,预测就是这1000个类别的概率,无法拓展
新增类别还得重新训练重新标注太了,能不能一劳永逸呢
这就是CLIP要解决的问题,预训练模型直接zero-shot
与前人工作对比
CLIP指出,17年就已经开始有这些方法了,但是没获得太多关注
17年类似方法Imagenet上的效果才十几个点,根本就不行
然后OpenAi说了。
您可能关注的文档
- 布鲁克纳交响曲全集:第一至第九交响曲.pdf
- 乘法公式应用专训:八种常见题型.pdf
- 乘法公式应用与题型.pptx
- 九年级英语上册:茶意外发明与传播.pdf
- 人教版九年级英语上册Unit 6 Section A 3a-3c教学设计.pptx
- 中考总复习历史专题10 世界近代史(选择题汇编)(原卷版).docx
- 2025山东省安装工程消耗量定额培训资料 第6册 自动化控制仪表安装工程(OCR).pdf
- 人教版六下数学第2课时--数的认识(2)(教材P73页例356)公开课教案课件课时作业课时训练.pptx
- -2022年全国政协工作报告重点学习PPT.pptx
- Oracle培训资料030710g11g参数SPFILE.ppt
原创力文档

文档评论(0)