图像识别与计算机视觉手册（执行版）.docxVIP

下载本文档

3
0
约3.26万字
约 49页
2026-06-23 发布于江西
举报

图像识别与计算机视觉手册（执行版）.docx

图像识别与计算机视觉手册（执行版）

第1章图像基础与预处理

1.1图像表示与数据类型

图像在计算机中的本质是一种二维矩阵，由像素点（Pixel）构成，每个像素包含一个红、绿、蓝（RGB）或黄、青、蓝（YCbCr）的亮度值。例如，一张1920x1080的图像，其数据量约为2000万（2^24）个字节，若使用8位灰度图，每个像素仅需1字节，总数据量仅为200万字节。

图像数据类型决定了其精度和存储效率，常见的有8位无符号整数（0-255）、8位有符号整数（-128到127）以及16位浮点数（0.0到1.0）。例如，在计算机视觉库中，OpenCV默认使用32位浮点型`cv::Mat`来保存图像，因为它能精确表示0.0到1.0之间的灰度值，避免了量化误差。在深度学习框架如PyTorch或TensorFlow中，图像通常被加载为张量（Tensor），其数据类型可能是`float32`或`float64`。例如，加载一张2400x1600的医学影像时，为了保留像素级的微小亮度变化，必须使用64位浮点型，否则在光照不均的区域会导致梯度消失。数据类型的选择直接影响计算精度，整数类型适合进行像素级的算术运算，而浮点型更适合进行卷积、池化等非线性变换。例如，在计算图像梯度时，若使用整数除法，结果可能为0，而

图像识别与计算机视觉手册（执行版）.docxVIP

图像识别与计算机视觉手册（执行版）.docx

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档