- 0
- 0
- 约5.98千字
- 约 37页
- 2026-03-24 发布于浙江
- 举报
大语言模型在计算机视觉领域的应用
大语言模型在计算机视觉领
域的应用
演讲人:冯佳时
目录0102背景介绍基于LLM的图像理解0304基于LLM的视频生成总结展望
目录
01
02
背景介绍
基于LLM的图像理解
03
04
基于LLM的视频生成
总结展望
背0景介绍
背0景介绍
计算机视觉的基本问题物体识别物体检测物体分割猫草地,猫,树,天空
计算机视觉的基本问题
物体识别
物体检测
物体分割
猫
草地,猫,树,天空
计算机视觉的基本问题图像生成视频生成3D生成大脑乘着火箭飞向月球大象戴着生日帽海底漫步黏土做的火车引擎图像和视频来自GoogleImagen
计算机视觉的基本问题
图像生成
视频生成
3D生成
大脑乘着火箭飞向月球
大象戴着生日帽海底漫步
黏土做的火车引擎
图像和视频来自GoogleImagen
LLM统一模型输入文本大语言模型(例如ChatGPT)情感分析生成翻译问答
LLM统一模型
输入文本
大语言模型
(例如ChatGPT)
情感分析
生成
翻译
问答
视觉基础模型–生成与理解的统一“在草地上奔跑的小猫”是否可基于LLM搭一个生成理解统一的视觉基础模型?基础模型图像理解图像生成“在草地上奔跑的小猫”
视觉基础模型–生成与理解的统一
“在草地上奔跑的小猫”
是否可基于
LLM搭一个生成理解统一的视觉基础模型?
原创力文档

文档评论(0)