117-计算机视觉中的特征提取难在哪里？【萌萌家】.pdf

下载文档

0
0
约3.09千字
约 5页
2025-03-14 发布于山东
举报
版权申诉
保障服务

117-计算机视觉中的特征提取难在哪里？【萌萌家】.pdf

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

117|计算机视觉中的特征提取难在哪里？

2018-08-29洪亮劼来自北京

《AI技术内参》

在上一次的分享中，我们聊了计算机视觉的一些最基础的操作和任务，包括像素表达和过滤器

这两个视觉问题。我们还简单介绍了边界探测这个任务，了解如何从计算机视觉的角度来对这

个任务进行建模。

今天，我们来看计算机视觉基础问题中的另一个核心任务，那就是特征（Feature）提取。

特征提取的目的

在深入讨论特征提取之前，我们先来了解一下特征提取的目的，或者说是研究特征提取的必要

性。

从大的方面来说，计算机视觉的一部分任务是实现对图像的智能理解。那么，理解图像的语义

就是其中一个非常重要的任务。

我们提到的边界检测或者是颜色检测，虽然都是理解图像的任务，但是这些任务并不理解图像

中具体的物体，比如哪里是一只动物、哪里是行人等。那么，怎样才能理解图像中具体的物体

呢？或者更进一步，整个图像表达了怎样的社会关系或者说是场景关系？例如一张会议室的图

像，我们不仅关心里面的陈设和人物，还关心会议室的整体气氛，以及这样的气氛是不是传递

出了更复杂的人物之间的社会关系。

那么，如何实现这种更高维度的语义理解呢？这往往需要我们对底层的一些图像先进行抽象，

然后再在抽象出来的特征基础上，进一步来建模。

除了我们这里提到的对图像本身的理解以外，在很多任务中，我们还需要对图像和其他信息结

合起来进行理解和分析。一种常见的形式是图像和一段文字结合起来，对某一个物品或者某一

个事件进行描述。例如电商网站的商品信息，一般都有精美的图片和详细的介绍，这些信息组

合起来完整地描述了整个商品的信息。

这个时候，我们就要同时理解图像和文字信息。很明显，在这样的任务中，一种比较容易想到

的模式是先从图像和文字中分别抽取一定的抽象特征，有了高度概括的图像特征和文字特征之

后，我们再在这个基础上进行建模。

从比较小的计算机视觉的任务来说，很多时候，一个任务会涉及到两个步骤：把任务抽象为提

取特征，然后转换为一个普通的机器学习任务。这个流程的第二步可以是一个监督学习任务，

例如回归或者分类；也可以是一个非监督学习任务。需要注意的是，我们这里提到的两个步

骤，并不一定是绝对地把建模过程当作两个完全独立的步骤，而是从逻辑上对这两个步骤进行

区分。事实上，在现代的深度学习架构中，这两个步骤往往都在统一的一个架构下进行训练，

从而能够得到更好的效果。

今天，我们就从传统的计算机视觉的角度，来看看特征提取有哪些难点和经典方法。

特征提取的难点及基本思路

图像数据的特征提取为什么有难度呢？原因在于图像信息本身的复杂性。

试想我们有两张人民大会堂的建筑物照片，一张是从地面拍摄的，一张是从空中拍摄的。虽然

这两张照片可能在角度、色彩、位置等方面有很多的不同，但是因为这两张照片本身所描述的

对象是一致的，都是人民大会堂，因此我们希望从这两个图片中提取的特征有一些相似性。也

就是说，我们需要找到在诸多变化因素中不变的成分。

一个经典的思路是从局部信息（LocalInformation）入手，从图像中提取相应的特征。从实

际的效果来看，局部特征（LocalFeature）比全局特征更加稳固。

回到上面的例子，如何构造一个能够匹配两个图片的普遍的局部特征呢？过程如下：第一，找

到一组关键的点或者是像素；第二，在关键点周围定义一个区域；第三，抽取并且归一化这个

区域；第四，从归一化后的区域提取“局部描述子”（LocalDescriptor）。得到局部描述子

之后，我们就可以利用它来进行匹配了。

从上面这个流程来看，整体的思路其实就是希望从局部找到具有代表性的特征，然后把所有因

为各种因素造成的特征变化归一化掉。

当然，这个简单的流程是有一些问题的。比如，如果我们针对两幅不同的图像分别进行上述的

流程，那么很有可能最后得到的关键点和局部描述子都不一样。所以我们需要一种更具普适性

的方法。

其实从70年代开始，就有一大部分的计算机视觉工作是在研究如何构建局部特征描述子。在

这30多年的发展历程中，很多研究工作者提出了不少既有理论基础又有实用价值的特征提取

方法。甚至是最近的深度学习热潮，从某种程度上来说也是一个重要的特征提取成果。

在这些研究成果中，比较有代表性的局部描述子包括SIFT（Scale-invariantfeature

transform）描述子和HOG（Histogramoforientedgradient）描述子。关于这两个描

述子，我在这里不展开介绍它们的细节，因为在深度学习浪潮中，大部分利用描述子来对特征

进行提取

您可能关注的文档

文档评论（0）

133****9720 + 关注: 实名认证

内容提供者

物业管理师证持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2023年04月23日上传了物业管理师证

1亿VIP精品文档

更多 >

117-计算机视觉中的特征提取难在哪里？【萌萌家】.pdf