网站大量收购独家精品文档,联系QQ:2885784924

116-掌握计算机视觉任务的基础模型和操作【萌萌家】.pdf

116-掌握计算机视觉任务的基础模型和操作【萌萌家】.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

116|掌握计算机视觉任务的基础模型和操作

2018-08-27洪亮劼来自北京

《AI技术内参》

今天,我们来聊一聊计算机视觉的一些最基础的操作和任务,包括像素表达、过滤器和边界探

测。基于这些内容,我们一起讨论利用计算机来处理视觉问题的核心思路。很多时候,越是基

础的内容就越重要,因为只有掌握了基础的思路,我们才能在今后复杂的任务中灵活应用。

像素表达

我们在上一次的分享中谈到了计算机视觉任务中一个非常重要的步骤,那就是把现实世界的信

号通过感知仪器(SensingDevice)收集起来,然后在计算机系统中加以表达。那么,在所

有的表达中,最基础的就是“像素表达”(Pixel)。我们这里就展开说一说这种表达的思

路。

把图像信息利用像素来进行表达是一种非常直观简单的表达方式。

对于黑白图像来说,图像就被转换为了0或者1的二元矩阵。这个矩阵的每一个元素就是一

个像素,0代表黑,1则代表白。

对于灰度图像来说,每一个像素,或者说是矩阵的每一个元素,代表灰度的“强度”

(Intensity),从0到255,0代表黑,255代表白。

对于彩色的图像来说,我们一般要先选择一种模型来表示不同的颜色。一种较为流行的表达方

式是RGB(红、绿、蓝)模型。在这样的模型中,任何一个彩色图像都能够转化成为RGB这

三种颜色表达的叠加。具体来说,就是RGB分别代表三种不同的“通道”(Channel)。每

一种通道都是原始图像在这个通道,也就是这个原始颜色下的表达。每一个通道都是一个矩阵

像素表达。每一个像素代表着从0到255的值。换句话说,一个彩色图像在RGB模型下,

是一个“张量”(Tensor),也就是三个矩阵叠加在一起的结果。

针对像素,你需要建立一种概念,那就是像素本身是对真实世界中的“采样”(Sample)。

每一个像素是一个整数,整个像素表达并不是一个“连续”(Continuous)表达。因此,在

把世界上的连续信号采样到离散像素的这一过程中,难免会有失真。而不同的“分辨率”,会

带来失真程度不同的像素表达。

过滤器

既然已经把图像表达成为了像素,也就是某种矩阵的形式,那么我们就可以利用线性代数等工

具在这个矩阵上进行变换,从而能够对图像进行某种操作。这就是“过滤器”(Filter)的一

个基本思想。

很多计算机视觉的操作本质上都是过滤器操作。除了把过滤器想成某种线性代数变换之外,更

普遍的一种思路是把在矩阵上的操作想成某种函数的操作。因此,我们也可以认为过滤器是函

数在某一个特定区间内的操作。

举一个最简单的过滤器的例子,就是“移动平均”(MovingAverage)。这个过滤器的本质

就是针对每一个像素点,计算它周围9个像素点的平均值。如果我们针对每一个像素进行这样

的操作,就会得到一个新的矩阵。然后我们把这个矩阵当作新的像素表达进行视觉化,就会发

现是在原有图像基础上进行了“柔化”处理。反过来,如果我们需要对某一个图像进行柔化处

理,就需要对其进行“移动平均”过滤操作。

有了这个直观的例子,你一定能够想到,很多我们熟知的图像特效处理,其实都对应着某种过

滤器操作。

这里,我们提及一种比较特殊的过滤处理,那就是“卷积”(Convolution)。这个概念我们

在深度学习中经常接触到。

刚才我们说到“移动平均”这个过滤器。如果我们把图像看作是一个函数F在某一个区域的取

值,那么,“移动平均”这个过滤器是针对函数在某一点的取值(也就是某一个像素的取

值),通过利用同样的函数F在周围的取值,从而得到一个新的计算值。

那卷积操作的思想是怎样的呢?卷积是针对F在某一个点的取值,除了需要利用F在周围的

点以外,还需要利用另外一个函数,这里称作是H的取值。也就是说,我们要利用H来针对

F进行操作。

边界探测

除了通过过滤器对图像进行简单操作之外,还有一些图像的基本操作蕴含了计算机视觉的基本

原理。我们这里也稍微做一些介绍。

例如我们通常需要了解图像的边界。有研究表明,图像的边界对于人类认知图像的内涵有着特

殊的意义。因此从一个完整的图像中找到不同物体的边界是一个很有现实意义的任务,并且通

常被称作是“边界探测”(EdgeDetection)。

那么,怎么来认识图像中的物体边界呢?我们先从直观上来想一想,在图像中,“边界”都有

什么特征?一般来说,如果我们遇到了色彩、景深、照明的突然变化,或者是其他某种图像特

质上的突然变化,我们就有可能遇到了边界。现在的问题是,在像

您可能关注的文档

文档评论(0)

133****9720 + 关注
实名认证
内容提供者

物业管理师证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年04月23日上传了物业管理师证

1亿VIP精品文档

相关文档