- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实用标准文案
精彩文档
HYPERLINK /changingivan/article/details/7795406 sift算法研究_无匹配
分类: HYPERLINK /changingivan/article/category/1182983 可视化搜索 2012-07-27 21:51 361人阅读 HYPERLINK /changingivan/article/details/7795406 \l comments 评论(0) HYPERLINK javascript:void(0); \o 收藏 收藏 HYPERLINK /changingivan/article/details/7795406 \l report \o 举报 举报
1 sift简介
David G. Lowe在1999年提出了尺度不变的特征(Scale-Invariant Feature),用来进行物体的识别和图像匹配等,并于2004年进行了更深入的发展和并加以完善。SIFT(Scale-Invariant Feature Transform)算子是一种图像的局部描述子,具有尺度、旋转、平移的不变性,而且对光照变化、仿射变换和3维投影变换具有一定的鲁棒性。在Mikolajczyk对包括SIFT算子在内的十种局部描述子所做的不变性对比实验中,SIFT及其扩展算法已被证实在同类描述子中具有最强的健壮性。
算法的主要思想是在尺度空间寻找极值点(注意不是平面上的极值点,因此需要过滤掉平面上的极值点),然后对极值点进行过滤,找出稳定的特征点。最后在每个稳定的特征点周围提取图像的局部特性,形成局部描述子并将其用在以后的匹配中。SIFT算法是基于Lindeberg[4]的理论解决了尺度不变性的问题,本文会对尺度空间理论做一些介绍。
2 尺度空间
SIFT算法提取的特征点具有尺度不变性,也就是说,同一物体在图片上不论尺度大小,都能根据SIFT算法提取到相同的特征点。这种尺度不变性是根据尺度空间理论得来的。
2.1 问题提出
在计算机中,一幅图像通常是用像素矩阵来表示的,每个像素拥有整数类型的灰度级,人理解和解释用这种方式表示的图像是很容易的一件事情。但是,如果每个灰度级用小数来表示,人就不容易理解图像。如今使用的矩阵表示法,图像中所蕴含的信息是隐式的。也就是说,人眼从图像中分辨出的有意义信息是隐式的,由于这些信息没有明确的表示出来,计算机并不能感知。对于计算机来说,一个基本的问题是一副图片中哪些点是相互关联的以及哪些点对应着一片场景中的一个物体。这就是原始分组和知觉组织的问题。从认知学的角度讲,在一幅图像中,即使对一个事物没有概念,或者并不熟悉它,人仍然能够感知此物体的结构。对于人脑来说,即使不知道为什么,也能推测场景中什么是重要的,什么仅是背景而已。
想要得知图像中哪些是有意义的,必须先要明确这样一个问题:在一幅图像中,只有在一定的尺度范围内,一个物体才有意义。举一个例子,树枝这个概念,只有在几厘米到几米的距离去观察它,才能感知到它的确是树枝;如果在微米级或者千米级去观察,就不能感知到树枝这个概念了,这样的话可以感知到的是细胞或者是森林的概念。
因而,如果想要描述现实世界的结构,或者将三维物体映射到二维的图像上去,多尺度表示将会至关重要。多尺度表示的概念很容易理解,举例说明,绘制地图时会有比例尺的概念。世界地图中就只能够显示大洲大洋,以及较大的地域和国家;而一个城市地图,甚至可以详细的显示出每条街道。
这里需要强调一点,事物是实实在在的存在的,但是通过图像这个媒介,观察者可以感知到的概念是不同的。
2.2 问题的解决
2.2.1 多尺度表示
为了使图像中的信息由只有人类可感知的隐式信息,成为计算机可表示的显式信息,可以采用“多尺度表示”(Multi-scale Representation)的图像表示法来解决。在进行图像处理和图像理解时,从图像中提取何种信息,对图像进行何种操作,都是要考虑的基本问题。为了有效的回答这些基本问题,可以对图像分阶段处理,前一阶段处理得到的信息可供后续的处理使用。对于第一阶段的处理,有个基本的约束——处理之前并不知道在图像的场景中到底要提取什么内容;而且,处理所得的特征相对于各种变换(例如光照的变化,图像的尺寸以及视角的变化)要具有鲁棒性。多尺度表示事先并不知道到底要使用哪些尺度,所以要计算得出所有的尺度以供后面的步骤使用。一个多尺度表示的示意图如图1 所示。
图1. 一个多尺度表示的示意图。多尺度表示是用一个有序的信号序列来表示原始图像,序列中的每个信号都在不同尺度上[5]。
多尺度表示的思想是,将原始信号“嵌入”到采用一个单参数变换得到的一系列信号中去,变换得到的每个信号对应于单参数族中的一个参数(例如图1
文档评论(0)