红外与近红外光谱常用数据处理算法.docVIP

红外与近红外光谱常用数据处理算法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
红外与近红外光谱常用数据处理算法

数据预处理 中心化变换 归一化处理 正规化处理 标准正态变量校正(标准化处理)(Standard Normal Variate,SNV) 数字平滑与滤波(Smooth) 导数处理(Derivative) 多元散射校正(Multiplicative Scatter Correction,MSC) 正交信号校正(OSC) 特征的提取与压缩 主成分分析(PCA) 马氏距离 模式识别(定性分类) 基于fisher意义下的线性判别分析(LDA) K-最邻近法(KNN) 模型分类方法(SIMCA) 支持向量机(SVM) 自适应boosting方法(Adaboost) 回归分析(定量分析) 主成分回归(PCR) 偏最小二乘法回归(PLS) 支持向量机回归(SVR) 数据预处理 中心化变换 中心化变换的目的是在于改变数据相对于坐标轴的位置。一般都是希望数据集的均值与坐标轴的原点重合。若xik表示第i个样本的第k个测量数据,很明显这个数据处在数据矩阵中的第i行第k列。中心化变换就是从数据矩阵中的每一个元素中减去该元素所在元素所在列的均值的运算: ,其中是n个样本的均值。 (2) 归一化处理 归一化处理的目的是是数据集中各数据向量具有相同的长度,一般为单位长度。其公式为: 归一化处理能有效去除由于测量值大小不同所导致的数据集的方差,但是也可能会丢失重要的方差。 (3)正规化处理 正规化处理是数据点布满数据空间,常用的正规化处理为区间正规化处理。其处理方法是以原始数据集中的各元素减去所在列的最小值,再除以该列的极差。 该方法可以将量纲不同,范围不同的各种变量表达为值均在0~1范围内的数据。但这种方法对界外值很敏感,若存在界外值,则处理后的所有数据近乎相等。 标准化处理(SNV)也称标准正态变量校正 该处理能去除由单位不同所引起的不引人注意的权重,但这种方法对界外点不像区间正规化那样的敏感。标准化处理也称方差归一化。它是将原始数据集各个元素减去该元素所在列的元素的均值再除以该列元素的标准差。 数字平滑与滤波 数字平滑与滤波的目的在于消除随机误差与仪器的噪声,它是一种最简单的滤波方法。平滑的实质是略去数据中较小的偏离,而保留具有较大偏离的部分。 设滤波值为,原始信号值为,两者间的关系如下: 式中,k为原始数据点的序号,2m+1表示窗口(滤波带宽)的大小,m为调节滤波带宽的参数。随着窗口的移动,即得到经过滤波后的7一系列信号值。滤波使数据的噪声减小,但在实际应用过程中应慎重选择滤波带宽,否则会扭曲数据结构。 导数处理 多元散射校正(msc) 由于样品的不均匀性(粒度分布)常导致所测的样品光谱具有很大的差异性,不同批号的同一样品所测的光谱从表面看,也可能有很大的差异。在许多情况下,散射引起的光谱变化可能要大于样品成分引起光谱的变化。散射的程度与光的波长、颗粒度和样品的折射指数等有关,因此在整个光谱范围内,散射的强度是不同的,通常表现为基线的平移、旋转、二次和高次曲线。 MSC是由Geladi等人提出的,目的是校正每个光谱的散射并获得较理想的光谱。MSC法假定与波长有关的散射对光谱的贡献和成分的贡献是不同的,理论上,通过光谱上许多点的数据分析,可以把这两部分分开。MSC方法认为每一条光谱都应该与“理想”光谱成线性关系,而真正的“理想”光谱无法得到,可以用校正集的平均光谱来近似。因此每个样品的任意波长点下反射吸光度值与其平均光谱的相应吸光度的光谱是近似线性关系,直线的截距和斜率可由光谱集线性回归获得,并用以校正每条光谱,截距(即附加效应)大小反映样品 独特反射作用,而斜率大小则反映样品的均匀性。 二、特征的提取与压缩 (1)主成分分析(PCA) 又称抽象因子分析,主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。 思想:利用降维的思想,把多指标转化为少数几个综合指标。在研究多变量问题时,变量太多会增大计算量和增加分析问题的复杂性,人们自然希望在进行定量分析的过程中涉及的变量较少,而得到的信息量又较多。主成分分析是解决这一问题的理想工具。(主要分析众多变量之间的相关性) 1.1主成分分析计算步骤 ① 计算相关系数矩阵 (1) 在(3.5.3)式中,rij(i,j=1,2,…,p)为原变量的xi与xj之间的相关系数,其计算公式为 (2) 因为R是实对称矩阵(即rij=rji),所以只需计算上三角元素或下三角元素即可。 ② 计算特征值与特征向量 首先解特征方程,通常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列,即;然后分别求出对应于特征值的特征向量。这里要

文档评论(0)

2017ll + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档