大语言模型在计算机视觉领域的应用-冯佳时.docxVIP

  • 0
  • 0
  • 约5.98千字
  • 约 37页
  • 2026-03-24 发布于浙江
  • 举报

大语言模型在计算机视觉领域的应用-冯佳时.docx

大语言模型在计算机视觉领域的应用

大语言模型在计算机视觉领

域的应用

演讲人:冯佳时

目录0102背景介绍基于LLM的图像理解0304基于LLM的视频生成总结展望

目录

01

02

背景介绍

基于LLM的图像理解

03

04

基于LLM的视频生成

总结展望

背0景介绍

背0景介绍

计算机视觉的基本问题物体识别物体检测物体分割猫草地,猫,树,天空

计算机视觉的基本问题

物体识别

物体检测

物体分割

草地,猫,树,天空

计算机视觉的基本问题图像生成视频生成3D生成大脑乘着火箭飞向月球大象戴着生日帽海底漫步黏土做的火车引擎图像和视频来自GoogleImagen

计算机视觉的基本问题

图像生成

视频生成

3D生成

大脑乘着火箭飞向月球

大象戴着生日帽海底漫步

黏土做的火车引擎

图像和视频来自GoogleImagen

LLM统一模型输入文本大语言模型(例如ChatGPT)情感分析生成翻译问答

LLM统一模型

输入文本

大语言模型

(例如ChatGPT)

情感分析

生成

翻译

问答

视觉基础模型–生成与理解的统一“在草地上奔跑的小猫”是否可基于LLM搭一个生成理解统一的视觉基础模型?基础模型图像理解图像生成“在草地上奔跑的小猫”

视觉基础模型–生成与理解的统一

“在草地上奔跑的小猫”

是否可基于

LLM搭一个生成理解统一的视觉基础模型?

文档评论(0)

1亿VIP精品文档

相关文档