清华社课件计算与人工智能第12章 计算机视觉与大模型.pptxVIP

  • 1
  • 0
  • 约2.51万字
  • 约 66页
  • 2026-05-25 发布于广东
  • 举报

清华社课件计算与人工智能第12章 计算机视觉与大模型.pptx

计算与人工智能概论问题求解、科学计算与AI应用方法第12章计算机视觉与大模型信息科学与工程学院

图像分类

目标检测

大语言模型目录

图像分类任务描述:对图像进行分类本任务聚焦图像分类问题,使用预先训练好的GoogLeNet模型(可判断1000个类别),判断输入的图片对应的是哪一种物品。图像分类是计算机视觉的基本任务之一,其目标是让计算机系统能够像人一样,通过视觉特征识别图像所属的类别。在本任务中,输入图像包含一种特定的物品或动植物。系统需提取图像中的关键特征,如轮廓、颜色、纹理、材质等标志性特征并基于这些特征进行分类决策。

图像分类相关知识:图像的数字化与输入表示数字图像:一个二维或三维的数值矩阵。最基本的组成单位是像素(Pixel,即“图像元素”)。灰度图像:每个像素对应一个灰度值,通常用0到255之间的整数表示,0代表黑色,255代表白色,中间值表示不同强度的灰色。整个图像可看作二维数组,其大小由图像的宽度(列数)和高度(行数)决定。彩色图像:每个像素由三个数值组成,分别对应红色、绿色和蓝色的强度。一张彩色图像在计算机中被表示为一个三维数组,其维度为“高度*宽度*3”。

图像分类相关知识:卷积神经网络卷积神经网络(ConvolutionalNeuralNetwork,CNN):一种专门用于处理具有网格结构数据的深度学习模型,在图像分类、目标检测等计算机视觉任务中表现出

文档评论(0)

1亿VIP精品文档

相关文档