清华社课件计算与人工智能第12章计算机视觉与大模型.pptxVIP

下载本文档

1
0
约2.51万字
约 66页
2026-05-25 发布于广东
举报

清华社课件计算与人工智能第12章计算机视觉与大模型.pptx

计算与人工智能概论问题求解、科学计算与AI应用方法第12章计算机视觉与大模型信息科学与工程学院

图像分类

目标检测

大语言模型目录

图像分类任务描述：对图像进行分类本任务聚焦图像分类问题，使用预先训练好的GoogLeNet模型（可判断1000个类别），判断输入的图片对应的是哪一种物品。图像分类是计算机视觉的基本任务之一，其目标是让计算机系统能够像人一样，通过视觉特征识别图像所属的类别。在本任务中，输入图像包含一种特定的物品或动植物。系统需提取图像中的关键特征，如轮廓、颜色、纹理、材质等标志性特征并基于这些特征进行分类决策。

图像分类相关知识：图像的数字化与输入表示数字图像：一个二维或三维的数值矩阵。最基本的组成单位是像素（Pixel，即“图像元素”）。灰度图像：每个像素对应一个灰度值，通常用0到255之间的整数表示，0代表黑色，255代表白色，中间值表示不同强度的灰色。整个图像可看作二维数组，其大小由图像的宽度（列数）和高度（行数）决定。彩色图像：每个像素由三个数值组成，分别对应红色、绿色和蓝色的强度。一张彩色图像在计算机中被表示为一个三维数组，其维度为“高度*宽度*3”。

图像分类相关知识：卷积神经网络卷积神经网络（ConvolutionalNeuralNetwork,CNN）：一种专门用于处理具有网格结构数据的深度学习模型，在图像分类、目标检测等计算机视觉任务中表现出

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

清华社课件计算与人工智能第12章计算机视觉与大模型.pptxVIP