图像识别与计算机视觉手册(执行版).docxVIP

  • 3
  • 0
  • 约3.26万字
  • 约 49页
  • 2026-06-23 发布于江西
  • 举报

图像识别与计算机视觉手册(执行版).docx

图像识别与计算机视觉手册(执行版)

第1章图像基础与预处理

1.1图像表示与数据类型

图像在计算机中的本质是一种二维矩阵,由像素点(Pixel)构成,每个像素包含一个红、绿、蓝(RGB)或黄、青、蓝(YCbCr)的亮度值。例如,一张1920x1080的图像,其数据量约为2000万(2^24)个字节,若使用8位灰度图,每个像素仅需1字节,总数据量仅为200万字节。

图像数据类型决定了其精度和存储效率,常见的有8位无符号整数(0-255)、8位有符号整数(-128到127)以及16位浮点数(0.0到1.0)。例如,在计算机视觉库中,OpenCV默认使用32位浮点型`cv::Mat`来保存图像,因为它能精确表示0.0到1.0之间的灰度值,避免了量化误差。在深度学习框架如PyTorch或TensorFlow中,图像通常被加载为张量(Tensor),其数据类型可能是`float32`或`float64`。例如,加载一张2400x1600的医学影像时,为了保留像素级的微小亮度变化,必须使用64位浮点型,否则在光照不均的区域会导致梯度消失。数据类型的选择直接影响计算精度,整数类型适合进行像素级的算术运算,而浮点型更适合进行卷积、池化等非线性变换。例如,在计算图像梯度时,若使用整数除法,结果可能为0,而

文档评论(0)

1亿VIP精品文档

相关文档