自然语言处理:大模型理论与实践 课件 第七章 多模态大模型架构.pptx

自然语言处理:大模型理论与实践 课件 第七章 多模态大模型架构.pptx

第七章多模态大模型架构;7.1概述

7.2ViT模型

7.3CLIP模型

7.4BLIP模型

7.5BLIP-2模型

;多种感官模态;多模态是什么?;多模态是什么?;多模态大模型;多模态任务;多模态任务;多模态技术演进;7.1概述

7.2ViT模型

7.2.1ViT模型架构

7.2.2ViT模型计算过程

7.2.3预训练与微调

7.3CLIP模型

7.4BLIP模型

7.5BLIP-2模型

;ViT模型(英文:VisionTransformer)是一种利用Transformer架构处理图像识别问题的深

文档评论(0)

1亿VIP精品文档

相关文档