偏最小二乘方法.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
偏最小二乘方法.ppt

(4) h α(主成分数)到步(5),否则到步(3)。 (5) 得到的Y为已经标准化,因此需按照标准化步骤的相反操作,将之恢复到原始坐标。 4.关于主成分数 若X和Y间关系符合线性模型,则描述模型的主成分数应与模型的维数相等。主成分数是偏最小二乘模型的重要性质。 由于测试数据一般隐含噪声,故主成分数通常与X的秩不相等。如前已述及,在实际问题的处理中,总是要消去一些因子(成分), 因为这些因子所表征的主要是测试误差、噪声及由于变量间相关所引起的共线问题等。 确定主成分数的一种方法是以式(6.8)中Fh的模数为判据。图6.3为模数 对主成分数所得关系曲线,可以选定某值作为门限,当 小于此值时,则停止迭代。 图6.3 与偏最小二乘中因子书的关系 另一种方法是运用F 检验来测试内在相关性(inner relation)以确证所建立的模型。 再一种方法为交叉验证法。在这种方法中计算一统计量PRESS(prediction residual sum of squares),即预测残差之平方和。如图6.4所示,显然,人们总是希望采用某一主成分数时所产生的PRESS为最小。但最小的位置常难以准确确定。用这种方法确定主成数非常类似于测定下限的概念。所谓测定下限即在噪声存在下最小可以检出的信号。在图6.4的情况下,因子数可取4—8。 图6.4 PRESS与因子数的关系 5. 应用实例—腐植酸和木质磺酸盐的荧光分光光度分析[5] 磺酸木质素(ligninsulfonate)是水中的一种污染物,可用荧光分光光度法测定.尽管此种方法具有高灵敏度和高选择性,但在磺酸木质素的测试中腐植酸和去污剂中的光白剂(optical whitener)对其严重干扰。这三种化合物的发射光谱重叠非常严重(见图6.5).由图可见,没有一个区域仅为一种化合物所具有的发射光谱. 图6.5 腐植酸(– — –),磺酸木质素(- - - -)和去污剂(——)的发射光谱(均由纯物质测试所得) 这三种化合物不仅发射光谱严重重叠,同时在溶液中相互间有影响,如图6.6所示,三种纯物质的发射光谱加和(—)与其混合溶液的发射光谱(––––)并不一样,这就进一步增加了问题的复杂性.但是借助于偏最小二乘法,可以进行单一成分的测试,所得结果尚较满意. 图6.6 腐植酸,磺酸木质素和去污剂纯溶液发射光谱加 和(——)及三物质混合溶液的发射光谱(- - - -) 首先,看一下二组分的情况,表6.1所示为腐植酸和磺酸木质素混合样品的浓度测定结果。 表6.1 腐植酸与磺酸木质素混合物溶液测试结果(μg/ml) 其中,预测误差为预测浓度与实际浓度之差.如对于小组分磺酸木质素,平均误差为-0.024(μg/ml),相应的标准偏差为0.085(μg/ml)。标准偏差所用公式为: 而非相似度因子(dissimilarity factor)的表达式为: 式中, sa2( Ex ) 为X阵的主成分模型所引进的残余标准方差。而s2为 s2= /(m – a) 其中,m为X 的维,a为主成分数,e为: 运用F显著性检验,其自由度为( m - a )/2 和( m - a )( n – a – 1 )/2 ,显著性水平为α,若s2 sa2 ( Ex )F ,则计算值可信。 若试样增加一组分,即去污剂(含光白剂),其结果示于表6.2。由此表可见,对于腐植酸和磺酸木质素来说,三组分与二组分浓度预测准确性大体上相当。对于去污剂来说,也得到了较好的结果。在表6.2的情况下,由于为三组分混合物,所以构造主成分模型时,也相应增加一因子。 表6.2 腐植酸,磺酸木质素和去污剂混合溶液测试结果(μgml) 若试样仍如表6.2,即混合物为三组分,但预测为两个组分,也就是说构造的预测模型为二因子,其结果示于表6.3。由此表可见,预测误差反而比表6.2为小。原因为:模型中少一因子,所以可使结果更稳定。 表6.3 三组分混合物,但仅测试腐植酸和磺酸木质素二组分(μg/ml) § 6.4 非线性偏最小二乘 非线性偏最小二乘与线性偏最小二乘的区别仅仅在于X与Y的内在相关性,即后者为一直线,而前者为一曲线,如一抛物线。 曲线的表示有多种数学模型,如二次多项式,三次多项式,指数函数和对数函数等。其中,最简单的为二次多项式: 式中,T,U分别为X,Y的得分矩阵,p’, Q’分别为X,Y的装载矩阵,a为某一主成分,这种最简单的二次项扩展的偏最小二乘可简记为QPLS,QPLS的基本思想是:将X和Y分别投影于t 和u:(1) 将X和Y分别以tp’和uq’近似;(2) 同时满足u和t 内在的二

文档评论(0)

蝶恋花 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档