- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
金字塔匹核:用图像特征集的判别分类
金字塔匹配核:用图像特征集的判别分类Kristen Grauman and Trevor Darrell2005年摘要判别学习是具有挑战性的,当实例是特征集,且这些集合的基数是变化的并缺乏任何有意义的排序。基于内核的分类方法可以学习复杂的决策边界,但当输入是无序集时内核必须以某种方式解决对应关系——通常一个计算昂贵的任务对大型数据集来说变得不切实际。我们提出了一个新的快速核函数——将无序的特征集映射到多分辨率直方图,并在这个空间计算加权直方图交叉核。这种“金字塔匹配”的计算量与特征的数量是成线性关系的,它基于匹配首次出现的最精细分辨率的单元格隐式地找到对应关系。因为内核并没有penalize(惩罚,使处于不利地位)额外特征的存在,它对杂波具有鲁棒性。我们展示核函数是正定的,这使其在最优解决方案只能保证Mercer内核的学习算法中的应用是有效的。我们在目标识别任务中验证了我们的算法,并证明它是准确的比当前的一些方法更快。引言用于计算机视觉的各种表示包括无序的特征集或部分集,其中每个集合有不同的基数,并在每个集合中的特征之间的对应关系是未知的。例如,一个图像可能由一组检测到的局部仿射不变区域描述,一个形状可以由一组定义在每个边缘点的局部描述符描述,或一个人的脸可以由一组不同的面部部分块表示。在这种情况下,特征向量集代表一个特定感兴趣类别(对象,场景,形状,人脸等)的单一实例,并且人们期望特征的数目在不同的例子——由于视点变化,闭塞,或由兴趣算子的不一致检测——中是不同的。用这种表示来执行如分类或识别这样的学习任务是具有挑战性的。虽然生成方法已经取得了一些成功,但基于内核的识别方法以有效地表示复杂的决策边界和概括(generalize well)未知数据[ 24,21 ]而著称。例如,支持向量机(SVM)是一种广泛使用的找出两类之间的最佳分离超平面的判别分类方法。核函数,衡量输入数据的相似性,向决策功能引入了非线性;内核非线性地将输入空间的两个实例映射到特征空间中的内积。然而,传统的基于核的算法被设计为固定长度的向量输入操作,其中每个输入向量对应于该实例的一个特定的全局属性;定义在的常用的通用内核(例如,高斯RBF,polynomial(多项式))不适用于向量空间。图1.金字塔匹配核交叉直方图成金字塔状形成的局部特征,近似于特征集之间的最佳匹配。在这项工作中,我们提出了一个金字塔匹配核——定义在无序特征集合上的允许它们被有效并高效地应用在基于核的学习方法中的新的核函数。每一个特征集被映射到一个在最精细水平保留单个特征的特性的多分辨率直方图上。然后使用加权直方图相交计算来比较直方图金字塔,我们显示了在匹配对第一次出现的最精细分辨率的直方图单元里定义的隐式的对应关系(见图1)。通过金字塔匹配度量的相似性近似于不平等基数(unequal cardinality)的特征集之间的最佳对应度量的相似性(即,在较低的基数集合中的最佳匹配点的部分匹配近似于较大的基数集合中的点的一些子集,这样匹配点之间的总的相似性是最大的)。我们的核是非常有效的并且可以在与集合的基数成线性的时间内被计算。我们证明了我们的核函数是正定的,这意味着它适合于与保证只为正定核收敛到一种独特的优化(例如,支持向量机)的学习方法一起使用。因为它不penalize多余数据点的存在,我们所提出的核对杂波是鲁棒的。我们将表明,这转化为用不同背景或遮挡来处理未分割图像的能力。核还respect输入集所固有的共生关系:代替单独的集合中的匹配功能,忽略一个集合中由特征所传达的潜在的依赖关系,我们的相似性度量捕捉特征的联合统计。解决这个问题的其他方法已被提出[25,3,12,27,16,20,14],但不幸的是,这些方法中的每一个都有以下缺点中的某一些:计算复杂度使大型特征集不可行;参数分布的限制可能无法充分描述数据;非正定(不保证对支持向量机唯一的解决方案)的内核;相同大小集合的限制;和不考虑特征集内的依赖关系。我们的方法解决了所有这些问题,产生了适用于在已经存在的任何基于核的学习范式中比较无序的,长度可变的特征集合的核。我们用目标识别任务证明了我们的算法,并显示其准确性比得上当前的方法,然而需要显著较少的计算时间。2.相关工作在本节中,我们将回顾基于特征集合的判别式分类的相关工作,采用内核和支持向量机进行识别及多分辨率图像表示。目标识别是一个具有挑战性的问题,需要来自一个分类器的强大的推广能力,以应对同一对象或对象类的图片的各种各样的光照,视角,闭塞,杂乱,类内外形和变形的发生。虽然研究者已显示出将支持向量机用于目标识别的有希望的结果,但他们通常使用全局图像特征 ——将图像作为一个整体的长度相等的特征,例如颜色或灰度直方图或原始像素数据的向量[5,1,17]。众所周知,这种全局表示对真实
文档评论(0)