计算机视觉与图像处理手册(执行版).docxVIP

  • 1
  • 0
  • 约3.3万字
  • 约 49页
  • 2026-06-07 发布于江西
  • 举报

计算机视觉与图像处理手册(执行版).docx

计算机视觉与图像处理手册(执行版)

第1章计算机视觉基础与数据预处理

1.1图像与视频的基本概念及几何变换

图像是二维离散的像素矩阵,而视频是由连续时间序列的图像帧组成的动态流,理解这一本质差异是后续处理的基础。在计算机中,图像通常以32位整数(uint32)或16位整数(uint16)的数组形式存储,每个像素代表一个RGB或灰度的数值,例如RGB图像中每个像素值为(255,255,255)表示全白。

几何变换包括平移、旋转、缩放和透视投影,这些操作通过矩阵乘法对像素坐标进行线性映射,例如将图像左上角像素(0,0)映射到位置(x,y)的计算公式为$x=x+t_x,y=y+t_y$。旋转操作常使用3x3变换矩阵,将图像顺时针旋转90度等价于逆时针旋转270度,矩阵形式为$M=\begin{bmatrix}0-1\\10\end{bmatrix}$,需配合边界填充或插值算法防止图像撕裂。缩放变换通过改变像素间距实现,例如将图像放大1.5倍意味着每个输出像素对应1.5个输入像素,这会导致图像模糊,需结合双线性插值算法平滑边缘。

透视投影模拟相机镜头的成像原理,将平面图像映射到曲面,如单应性矩阵H将3D点$(X,Y,Z)$投影到2D平面$(x,y)=

文档评论(0)

1亿VIP精品文档

相关文档