- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
117|计算机视觉中的特征提取难在哪里?
2018-08-29洪亮劼来自北京
《AI技术内参》
在上一次的分享中,我们聊了计算机视觉的一些最基础的操作和任务,包括像素表达和过滤器
这两个视觉问题。我们还简单介绍了边界探测这个任务,了解如何从计算机视觉的角度来对这
个任务进行建模。
今天,我们来看计算机视觉基础问题中的另一个核心任务,那就是特征(Feature)提取。
特征提取的目的
在深入讨论特征提取之前,我们先来了解一下特征提取的目的,或者说是研究特征提取的必要
性。
从大的方面来说,计算机视觉的一部分任务是实现对图像的智能理解。那么,理解图像的语义
就是其中一个非常重要的任务。
我们提到的边界检测或者是颜色检测,虽然都是理解图像的任务,但是这些任务并不理解图像
中具体的物体,比如哪里是一只动物、哪里是行人等。那么,怎样才能理解图像中具体的物体
呢?或者更进一步,整个图像表达了怎样的社会关系或者说是场景关系?例如一张会议室的图
像,我们不仅关心里面的陈设和人物,还关心会议室的整体气氛,以及这样的气氛是不是传递
出了更复杂的人物之间的社会关系。
那么,如何实现这种更高维度的语义理解呢?这往往需要我们对底层的一些图像先进行抽象,
然后再在抽象出来的特征基础上,进一步来建模。
除了我们这里提到的对图像本身的理解以外,在很多任务中,我们还需要对图像和其他信息结
合起来进行理解和分析。一种常见的形式是图像和一段文字结合起来,对某一个物品或者某一
个事件进行描述。例如电商网站的商品信息,一般都有精美的图片和详细的介绍,这些信息组
合起来完整地描述了整个商品的信息。
这个时候,我们就要同时理解图像和文字信息。很明显,在这样的任务中,一种比较容易想到
的模式是先从图像和文字中分别抽取一定的抽象特征,有了高度概括的图像特征和文字特征之
后,我们再在这个基础上进行建模。
从比较小的计算机视觉的任务来说,很多时候,一个任务会涉及到两个步骤:把任务抽象为提
取特征,然后转换为一个普通的机器学习任务。这个流程的第二步可以是一个监督学习任务,
例如回归或者分类;也可以是一个非监督学习任务。需要注意的是,我们这里提到的两个步
骤,并不一定是绝对地把建模过程当作两个完全独立的步骤,而是从逻辑上对这两个步骤进行
区分。事实上,在现代的深度学习架构中,这两个步骤往往都在统一的一个架构下进行训练,
从而能够得到更好的效果。
今天,我们就从传统的计算机视觉的角度,来看看特征提取有哪些难点和经典方法。
特征提取的难点及基本思路
图像数据的特征提取为什么有难度呢?原因在于图像信息本身的复杂性。
试想我们有两张人民大会堂的建筑物照片,一张是从地面拍摄的,一张是从空中拍摄的。虽然
这两张照片可能在角度、色彩、位置等方面有很多的不同,但是因为这两张照片本身所描述的
对象是一致的,都是人民大会堂,因此我们希望从这两个图片中提取的特征有一些相似性。也
就是说,我们需要找到在诸多变化因素中不变的成分。
一个经典的思路是从局部信息(LocalInformation)入手,从图像中提取相应的特征。从实
际的效果来看,局部特征(LocalFeature)比全局特征更加稳固。
回到上面的例子,如何构造一个能够匹配两个图片的普遍的局部特征呢?过程如下:第一,找
到一组关键的点或者是像素;第二,在关键点周围定义一个区域;第三,抽取并且归一化这个
区域;第四,从归一化后的区域提取“局部描述子”(LocalDescriptor)。得到局部描述子
之后,我们就可以利用它来进行匹配了。
从上面这个流程来看,整体的思路其实就是希望从局部找到具有代表性的特征,然后把所有因
为各种因素造成的特征变化归一化掉。
当然,这个简单的流程是有一些问题的。比如,如果我们针对两幅不同的图像分别进行上述的
流程,那么很有可能最后得到的关键点和局部描述子都不一样。所以我们需要一种更具普适性
的方法。
其实从70年代开始,就有一大部分的计算机视觉工作是在研究如何构建局部特征描述子。在
这30多年的发展历程中,很多研究工作者提出了不少既有理论基础又有实用价值的特征提取
方法。甚至是最近的深度学习热潮,从某种程度上来说也是一个重要的特征提取成果。
在这些研究成果中,比较有代表性的局部描述子包括SIFT(Scale-invariantfeature
transform)描述子和HOG(Histogramoforientedgradient)描述子。关于这两个描
述子,我在这里不展开介绍它们的细节,因为在深度学习浪潮中,大部分利用描述子来对特征
进行提取
您可能关注的文档
- 026-ICML2018论文精读:聊一聊机器学习算法的“公平性”问题【萌萌家】.pdf
- 027-ICML2018论文精读:优化目标函数的时候,有可能放大了“不公平”?【萌萌家】.pdf
- 031-经典搜索核心算法:TF-IDF及其变种【萌萌家】.pdf
- 035-机器学习排序算法:配对法排序学习【萌萌家】.pdf
- 038-“查询关键字理解”三部曲之解析【萌萌家】.pdf
- 043-文档理解第一步:文档分类【萌萌家】.pdf
- 046-大型搜索框架宏观视角:发展、特点及趋势【萌萌家】.pdf
- 048-搜索索引及其相关技术概述【萌萌家】.pdf
- 049-PageRank算法的核心思想是什么?【萌萌家】.pdf
- 051-社区检测算法之“模块最大化”【萌萌家】.pdf
文档评论(0)