网站大量收购独家精品文档,联系QQ:2885784924

117-计算机视觉中的特征提取难在哪里?【萌萌家】.pdf

117-计算机视觉中的特征提取难在哪里?【萌萌家】.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

117|计算机视觉中的特征提取难在哪里?

2018-08-29洪亮劼来自北京

《AI技术内参》

在上一次的分享中,我们聊了计算机视觉的一些最基础的操作和任务,包括像素表达和过滤器

这两个视觉问题。我们还简单介绍了边界探测这个任务,了解如何从计算机视觉的角度来对这

个任务进行建模。

今天,我们来看计算机视觉基础问题中的另一个核心任务,那就是特征(Feature)提取。

特征提取的目的

在深入讨论特征提取之前,我们先来了解一下特征提取的目的,或者说是研究特征提取的必要

性。

从大的方面来说,计算机视觉的一部分任务是实现对图像的智能理解。那么,理解图像的语义

就是其中一个非常重要的任务。

我们提到的边界检测或者是颜色检测,虽然都是理解图像的任务,但是这些任务并不理解图像

中具体的物体,比如哪里是一只动物、哪里是行人等。那么,怎样才能理解图像中具体的物体

呢?或者更进一步,整个图像表达了怎样的社会关系或者说是场景关系?例如一张会议室的图

像,我们不仅关心里面的陈设和人物,还关心会议室的整体气氛,以及这样的气氛是不是传递

出了更复杂的人物之间的社会关系。

那么,如何实现这种更高维度的语义理解呢?这往往需要我们对底层的一些图像先进行抽象,

然后再在抽象出来的特征基础上,进一步来建模。

除了我们这里提到的对图像本身的理解以外,在很多任务中,我们还需要对图像和其他信息结

合起来进行理解和分析。一种常见的形式是图像和一段文字结合起来,对某一个物品或者某一

个事件进行描述。例如电商网站的商品信息,一般都有精美的图片和详细的介绍,这些信息组

合起来完整地描述了整个商品的信息。

这个时候,我们就要同时理解图像和文字信息。很明显,在这样的任务中,一种比较容易想到

的模式是先从图像和文字中分别抽取一定的抽象特征,有了高度概括的图像特征和文字特征之

后,我们再在这个基础上进行建模。

从比较小的计算机视觉的任务来说,很多时候,一个任务会涉及到两个步骤:把任务抽象为提

取特征,然后转换为一个普通的机器学习任务。这个流程的第二步可以是一个监督学习任务,

例如回归或者分类;也可以是一个非监督学习任务。需要注意的是,我们这里提到的两个步

骤,并不一定是绝对地把建模过程当作两个完全独立的步骤,而是从逻辑上对这两个步骤进行

区分。事实上,在现代的深度学习架构中,这两个步骤往往都在统一的一个架构下进行训练,

从而能够得到更好的效果。

今天,我们就从传统的计算机视觉的角度,来看看特征提取有哪些难点和经典方法。

特征提取的难点及基本思路

图像数据的特征提取为什么有难度呢?原因在于图像信息本身的复杂性。

试想我们有两张人民大会堂的建筑物照片,一张是从地面拍摄的,一张是从空中拍摄的。虽然

这两张照片可能在角度、色彩、位置等方面有很多的不同,但是因为这两张照片本身所描述的

对象是一致的,都是人民大会堂,因此我们希望从这两个图片中提取的特征有一些相似性。也

就是说,我们需要找到在诸多变化因素中不变的成分。

一个经典的思路是从局部信息(LocalInformation)入手,从图像中提取相应的特征。从实

际的效果来看,局部特征(LocalFeature)比全局特征更加稳固。

回到上面的例子,如何构造一个能够匹配两个图片的普遍的局部特征呢?过程如下:第一,找

到一组关键的点或者是像素;第二,在关键点周围定义一个区域;第三,抽取并且归一化这个

区域;第四,从归一化后的区域提取“局部描述子”(LocalDescriptor)。得到局部描述子

之后,我们就可以利用它来进行匹配了。

从上面这个流程来看,整体的思路其实就是希望从局部找到具有代表性的特征,然后把所有因

为各种因素造成的特征变化归一化掉。

当然,这个简单的流程是有一些问题的。比如,如果我们针对两幅不同的图像分别进行上述的

流程,那么很有可能最后得到的关键点和局部描述子都不一样。所以我们需要一种更具普适性

的方法。

其实从70年代开始,就有一大部分的计算机视觉工作是在研究如何构建局部特征描述子。在

这30多年的发展历程中,很多研究工作者提出了不少既有理论基础又有实用价值的特征提取

方法。甚至是最近的深度学习热潮,从某种程度上来说也是一个重要的特征提取成果。

在这些研究成果中,比较有代表性的局部描述子包括SIFT(Scale-invariantfeature

transform)描述子和HOG(Histogramoforientedgradient)描述子。关于这两个描

述子,我在这里不展开介绍它们的细节,因为在深度学习浪潮中,大部分利用描述子来对特征

进行提取

文档评论(0)

133****9720 + 关注
实名认证
内容提供者

物业管理师证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年04月23日上传了物业管理师证

1亿VIP精品文档

相关文档