最常见的近红外光谱的预处理关键技术的综述.docVIP

  • 37
  • 0
  • 约1.52万字
  • 约 31页
  • 2020-10-25 发布于江苏
  • 举报

最常见的近红外光谱的预处理关键技术的综述.doc

最常见近红外光谱预处理技术综述 smund Rinnan, Frans van den Berg, S?ren Balling Engelsen 摘要:预处理在近红外(NIR)光谱数据处理化学计量学建模中已经成为不可分割一部分。预处理目标是消除光谱中物理现象在为了提升后续多元回归、分类模型或探索性分析。最广泛使用预处理技术能够分为两类:散射校正方法和光谱间隔方法。综述和比较了算法基础理论和目前预处理方法和定性和定量后果应用程序。其目标是提供愈加好NIR最终模型建立,在此我们经过对光谱预处理基础知识进行梳理。 关键词:乘法散射校正;近红外光谱法;标准化;诺里斯威廉姆斯推导;预处理;Savitzky-Golay平滑;散射校正;光谱导数;标准正态变量;综述 引言 现在为止,没有能够优化数据来进行替换,不过经过合适数据搜集和处理将会起到优化效果,对光谱数据进行预处理是最关键一步(比如最优化之前叠层建模),常见方法有主成份分析(PCA)和偏最小二乘法(PLS)。在大量文件中,多变量光谱应用食品、饲料和医药分析,比较不一样预处理结果研究模型估计结果是不可分割组成部分。近红外反射/透射率(NIR / NIT)光谱光谱技术,到现在为止最多被使用和最大多样性在预处理技术,关键是因为入非线性光散射光谱能够引发显著影响。因为类似规模波长电磁辐射和粒子大小近红外光谱在生物样品,近红外光谱技术是一个不被广泛使用是因为存在散射效应(包含基线转变和非线性),这将会影响样品光谱结果统计。然而,经过应用适宜预处理,能够很大程度上消除这些影响。 在应用研究中,比较了几乎完全不一样定标模型(定量描述符和对应关系)。几乎没有出现评定差异和相同性报道。替换技术即修正含义(比如,谱描述符数据)在研究中极少被讨论。本文意在讨论建立了预处理方法对近红外光谱和模型之间关系,更具体地说,这些技术全部是对应独立响应变量,所以我们只讨论方法,不需要一个响应值。我们同时关注预处理工艺理论方面和实际效果,这种方法适适用于近红外光谱/ NIT光谱。 对固体样品,干扰系统差异关键是因为光散射不一样和有效路径长度不一样。这些不受欢迎改变常常组成了样本集总变异关键部分,能够观察到得转变基线(乘法效应)和其它现象称为非线性。通常来说,近红外光谱反射率测量一个示例将测量普及性反应和镜面反射辐射(镜面反射)。镜面反射通常由仪表设计和几何采样最小化,因为它们不含任何化学信息。这个diffusively反射光,这反应在广泛方向,是信息关键起源在近红外光谱。然而,diffusively反射光将包含信息化学成份不仅示例(吸收)而且结构(散射)。关键形式光散射(不包含能量转移和样品)瑞利和洛伦兹米氏。二者全部是过程中电磁辐射是分散(比如,经过小粒子,泡沫,表面粗糙度,水滴,晶体缺点,microorganelles、细胞、纤维和密度波动)。 当粒子尺寸大于波长,因为通常情况下,NIR光谱,是关键洛仑兹米氏散射。相比之下,瑞利散射,是各向异性,洛伦兹米氏散射依靠形状散射粒子和不强烈波长依靠性。 对生物样品,散射特征是过于复杂,所以软或自适应赔偿,光谱预处理技术,正如我们近红外光谱在本文中进行讨论,要求删除散射从纯粹、理想吸收光谱。 显然,预处理不能纠正镜面反射率(直接散射),自谱不包含任何精细结构。光谱关键由镜面反射率应该总是被移除之前为离群值多元数据分析,因为她们仍将是局外人,甚至在预处理。图1显示了一组13好蔗糖和样品不一样粒径加一坏蔗糖例子展示怎样(极端)镜面反射率表现比正常光谱。 图1还演示了总体布局大多数数据在本文中。上部图,一个条形图显示了主成份得分值第一主成份(PC)后样本集数据意味着定心[1]。下面部分显示预处理效果数据集(或,在这种情况下,任何预处理)。相关系数r平方值之间酒吧和一个选定参考变量包含(在本例中,已知平均粒径13蔗糖样本)。蔗糖数据集,这种关系应该是低,比如,当假设散射是一个阻碍粒子始发;尽可能小信息粒度应该保持在正确预处理。 图 SEQ 图表 \* ARABIC 1近红外光谱13蔗糖和样品不一样粒径(最小粒子在底部,最大顶部;粒子尺寸范围在20 - 540 lm。黑色光谱显示了一个镜面反射率蔗糖样本。酒吧是分数值第一主成份13个蔗糖样品主成份分析模型在完整光谱。 一个示例数据预处理蔗糖中能够看到图2,其中也包含一个其实一个示例数据预处理蔗糖中能够看到图2,其中也包含一个其实 从现在起,在这篇文章中,我们将演示效果不一样预处理技术在小果胶数据集只包含7个样品有不一样程度酯化(%德;范围在0 - 93%)[2]。这些样品测定近红外光谱反射率模式在光谱范围1100 - 2500海里(搜集每2海里区间;图3)。我们提供对应第一原因PCA样本得分后作为一个条形图意味着定心,连同集中吸光度

文档评论(0)

1亿VIP精品文档

相关文档