- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于拉普拉斯算法高光谱数据降维研究
基于拉普拉斯算法高光谱数据降维研究
摘 要:高光谱数据具有波段丰富,信息量大,数据呈线性特征等特点,因此带来了大量的数据冗余,使得数据降维极其必要。而传统的数据降维方法优势集中在线性计算上,但处理速度缓慢,容易遗漏了部分局部信息,没有很好地挖掘数据的非线性特征。针对这一问题,本文提出了基于拉普拉斯的高光谱数据降维方法,相比较传统主成分分析降维方法,加快了数据处理速度,提高了影像的分类精度,实验证明该方法可以在降维的同时有效完整留取影像中的信息。
关键词:高光谱;拉普拉斯;降维
引言
高光谱影像波段达上千个,波谱范围广,分辨率可达纳米级,波谱信息丰富。在获取目标影像的过程中,利用几十甚至上百个波段对目标进行成像,它不仅可以获取空间域信息,还具有光谱域信息,即具有“谱像合一”的特点,但这也意味着他增加目标空间信息的同时,也产生了大量的冗余数据,带来了维度的危机,增加了目视解译的判别难度。当波段的数量成倍迅猛增加的时候,数据的分析量大而且处理缓慢[1]。因此,需要研究新的数据降维方法,它既能降低数据量,同时又可以消除冗余信息。
在高光谱数据采集的过程中,伴随着地面散射等多个步骤,其表述模型和最小反射率波长在此过程中都呈现出了非线性变化,除此以外,单个像元内可能会具有亚像元成分,并且其内部存在多种散射现象。在种种因素的协同作用下,使得高光谱数据具有了非线性的特点。而传统的数据降维方法主要是基于线性变换原理,以主成分分析为例,它的主要原理是实现波段各个成分的去相关,可将特征影像中的主成分信息通过计算和变换组合到新的特征空间中。计算方法简单,适用于线性数据,因此被广泛应用。但此方法并不能有效挖掘高光谱数据的非线性特征,造成了局部信息在某种程度上的流失。对于这样的一个困局,提出了基于流形学习的降维方法[2]。该方法是一种非线性数据处理手段,其目的是发现嵌在高维空间中待测数据的低维光滑流形。其中拉普拉斯特征映射(LE)这种流形学方法可以有效克服数据维数过大带来的灾难。
1.基于拉普拉斯算子的降维方法
拉普拉斯算子是一种非线性降维方法,在数据从高维转换为低维的过程中,试图保留数据的嵌入流形的局部性质信息。它的主要思想是选取距离很近的样本点,在其从高维空间转换到低纬度空间依然保持样本点的临近。
如果样本是从高维向低维度这种转换过程中均匀采样的情况下,则可以通过运用拉普拉斯矩阵来逼近。利用核函数分配一个权重高于近点的值参与计算:
Lv=λMv(1)
ν表示特征向量。对应的特征向量的形式表示的是从原始高维到低维数据数据最小非零特征值。与其他非线性降维方法相比,拉普拉斯特征降维的优点是它的简单性和较低的算法计算成本。最近邻域(NN)问题的定义如下:n个点在和d维空间X 里,即P={p1,p2,p3...Pn },找到最接近查询点所有的非线性降维方法需要一个k最近邻搜索,其目标是找到k最近的邻居的每一点为基础来表示流形。这种方法的不利方面由于计算成本大产生了一个非线性降维方法瓶颈。其对应于最近邻域NN,近似最近邻(ANN)被定义为:找到一个点q∈P,在近似最近邻域中查询点q,即所有数据的p′∈P,ε代表的是近似最近邻域:
D(p,q)≤(1+ε)D(p′,q)(2)
2.实验结果与分析
2.1数据介绍
本文数据采用的是 THEMIS公司生产的VNIR400H 高光谱相机捕获的影像。其数据为2.8 nm的步长,覆盖的波段范围从可见光波段到近红外波段(370 nm-1040 nm)。图像分辨率为1像素为260毫米,260毫米×物理表面面积即是影像的面积。通过这样的高分辨率(每平方毫米30像素)仪器,可以获取可靠的空间数据。
2.2基于拉普拉斯算子的壁画数据降维
首先,传统降维方法主成分分析(PCA)的主要原理是波段的去相关以及选取特征波段。从对比主成分分析(PCA)和拉普拉斯特征映射(LE)算法的主要原理和思想出发,可初步判定和比较着两种算法应用到二维空间中的能力。拉普拉斯特征映射算法的基本原理都是来自于图谱理论的,其主要的应用程序花费了大量的时间在构建光谱分解邻接图,在数据处理中很可能会侵占大量内存,从而限制该方法在处理高光谱等大型数据中的应用。
实验数据参与降维的波段共200个,将该影像数据进行规格化的拉普拉斯(LE)降维处理,计算影像中的纯净像元指数。图为佛像数据样本经过降维后特征维数与剩余方差的关系,其中拉普拉斯前面5个分量就可以有效保留的原始佛像数据影像,仅采用各波段就能留存大量信息(如图1所示)。与此相反的是传统降维方法则需要大概35个分量左右,可见这种算法可以将信息集中在少数分量上,要远胜于主成分分析法。从速度上看,该方法也可以实现较快的信息
文档评论(0)