- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SIFT特征的生成般包括以下几个步骤
基本概念:降采样:对于一幅图像而言的降采样就是每隔几行、几列取一点,组成一个新的图像。对比例因子为2的降采样来说:就是对一幅图像每隔一行一列取一点。对于n×n的图像就变为n/2×n/2的图像了。升采样:其实一种插值,就是在一幅图像里利用相关的插值运算得到一幅大的图像!比例因子为2的升采样就是每个相邻像素点插值种出一个像素(这里包括X、Y两个方向)。对于n×n的图像就变为2n×2n的图像了。顺便说下插值,就是一种利用已有数据对位置数据的估计。比如我第10秒走了12米,第20秒走了30米,那么我用线性插值估计我第15秒走了(30-12)/2+12=21米,当然插值的方法有很多!图像金字塔:简单的说是一个图像集,由一个原始图像经过降采样得到一幅图像,再对新的图像做降采样,重复多次构成的一组集合。如果形象的把这些图像摞起来就想一个金字塔,故此得名。卷积:这个概念我感觉是最不好解释的,他就是一个积分,两个函数(其中一个带参数)对应点的乘积,然后把乘积函数求积分!大致我理解就是这样,但是具体的还是请大家去查书。但是这里我想说卷积再图像里的运算。卷积是一种无限的积分运算,但是因为在一个二维平面(X轴对应一个卷积函数,Y轴对应一个卷积函数!),一般境况下围绕某一点的卷积运算距离卷几点一定远的运算对最后结果很小,所以通常忽略!这样卷积运算就变成了一种模板运算!例如3×3的一种模板运算,就是把离他最近的9个点(包括它本身9个点)分别乘以按一定的加权函数所对应的权值后加到这个中心点上成为该点的新值。那么对于3×3的模板运算每一点要做9个乘法9个加法。那么对于1000个像素的图像做模板运算就要做9000个乘法,9000加法!如果模板再大,计算次数会更多。高斯卷积:就是权函数为高斯函数的卷积模板运算,高斯卷积有一次和二次...。通常做高斯卷积后的图像会比原图像平滑但也会模糊,所以又称高斯模糊!因为这不能写公式,很多的细节可以看下面的附件里的图片!高斯金字塔:高斯金字塔里有两个概念:组(Octave)和层(Level或Interval),每组里有若干层!高斯金字塔的构造是这样的,第一组的第一层为原图像,然后将图像做一次高斯平滑(高斯卷积、高斯模糊)高斯平滑里有一个参数σ(详见附件图片),在SIFT里作者取1.6然后将σ乘一个比例系数k作为新的平滑因子来平滑第一组第二层得到第三层。重复若干次,得到L层他们分别对应的平滑参数为:0,σ,kσ,k2σ....。然后将最后一幅图像做比例因此为2的降采样得到第二组的第一层,然后对第二组的第一层做参数是σ的高斯平滑,对第二层做kσ的平滑得到第三层.....这里一定注意:每组对应的平滑因子是一样的!而不是像有的资料上说的持续递增。这样反复形成了O组L层。一般模糊的高斯模板长宽都约为6σ(这里σ为当次的平滑因子,就是可能是kσ,k2σ..)DoG(Difference of Gaussian)金字塔:他是由高斯金字塔构造出来的,他的第一组第一层是由高斯金字塔的第一组第二层减第一组第一层,他的第一组第二层是由高斯金字塔的第一组第三层减第一组第二层得到,(说的这么繁琐是为了大家能理解的直观点)。没组都这样就生成了DoG金字塔。顺便说一下,DoG金字塔每组图像几乎都是一片黑,但仔细看你能看出轮廓的。两个金字塔在SIFT算法里的特殊说明:1、在SIFT里高斯金字塔的第一组第一层通常是由一个原图像长宽扩大一倍开始的,这样做是为了可以得到更多的特征点2、大家可以发现如果用每组5层的高斯金字塔构造一个DoG金字塔的的话,DoG的每组的层数是4。3、对于DoG金字塔,特征点的搜索从每组的二层到倒数第二层的(后面说明为什么),所以如果实际用n层那么DoG金字塔应该有n+2层,那么对应的高斯金字塔应该有n+3层。4、由于这样所以高斯金字塔从第二组开始的每组第一层是由上一组的倒数第二层降采样得到的。梯度:就是一个有方向和长度的向量,它的意义是一个函数的某一点上数值变化最大的方向和变化量。在图像中一个像素点的梯度是由它周围的8个点计算得到的。(公式见附件的图)K-d树:一种数据结构,用于搜索高维最邻近点,他是一种二叉树,每个节点是一个高维向量。对于他的具体说明我没仔细看呢,如果做到最后需要请大家参考这个:顺便说下维基百科不错!! ?尺度:这个概念最让我郁闷,现在弄的不是很清楚。我现在的理解就是(这不是它的概念):1、表示同一事物所用到的图像像素量,用的多尺度就小,用的少尺度就大(说没说反?嘿嘿!)。2、它和图像的清晰程度有关,如上面说的高斯模糊,那么因子σ越大得到的图像越模糊,那么尺度越大!3、图像的旋转、平移尺度是不变的,但是放大、缩小、模糊就变了。尺度空间理论 尺度空间理论目的是模拟图像数据的多尺度特征。其基本思想是在视觉信息、图像信息处理
您可能关注的文档
最近下载
- 全国优质课一等奖初中数学九年级下册《三视图》公开课精美课件.pptx
- 国家开放大学电大《企业信息管理(本)》期末题库及答案.docx VIP
- 新形态一体化教材建设 .pptx
- 《新能源汽车试验学》课件 第1--3章 绪论、 试验评价概述、 动力性试验.pptx
- 猪场母猪人工输精考核考试试卷.docx
- 招标代理年度工作总结范文6篇.docx VIP
- CRH380A动车组转向架部件设计与优化 .doc
- 阎石《数字电子技术基础》(第6版)配套题库【考研真题精选+章节题库】.pdf
- 基于comsol的树脂基复合材料固化成型过程多场耦合仿真.pdf
- T∕CECS 907-2021 轻质隔墙板技术规程.pdf
文档评论(0)