基于PLS成分变量筛选法.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
维普资讯 第 1卷 第2期 信 息 与 电 子 工 程 Vo1.1,No.2 2003年6月 1】、FoRM ATIoNAND ELECTRoNlCENGINEERING Jun.,2003 文章编号 :1672—2892(2003)02—0031-05 基于PLS成分的变量筛选法 李世玲 (中国工程物理研究院 电子工程研究所,四川 绵阳621900) 摘 要:就多元线性回归模型,提出一种基于 PLS成分的变量筛选法。其基本思想是利用 偏最小二乘回归原理,提取系统的两个主要成分,然后根据变量入选原则,保留对因变量影响较 大的变量;再利用 PLS成分筛选剩下的变量,经有限次筛选,即可得到最佳变量子集。应用算 例证实了这一方法的有效性和可行性。 关键词:线性回归;PLS成分;入选原则;变量筛选 中图分类号:0224 文献标识码:A 1 引言 当采用回归分析处理实际问题时,首先需要选择回归变量。一般而言,根据问题本身的专业理论及有关经 验,人们罗列出可能与因变量有关的变量往往较多。如果回归模型含有对因变量无影响或影响不大的变量,则 不仅会增加计算量,而且会使模型变得不稳定;反之,如果遗漏某些重要变量,回归分析的结果会变差,有时 还会产生一些难以解释的参数估计值。因此,就一个实际问题建立多元线性回归模型时,对进入模型的自变量 作精心选择是十分必要的。 近年来发展起来的偏最小二乘回归 (partialleast—squaresregression)方法,在对多变量系统信息进行辨识 和筛选过程中,采取循环式信息分解与提取方法。它不仅吸取了主成分回归从 自变量集合中提取信息的思路u】, 还注意了主成分回归中所忽略的自变量对因变量的解释作用。该方法意义明确,计算简单、省时,建模效果好, 解释性强,可在比主成分回归少用因子的情况下达到最小均方误差Ⅲ。遗憾的是它同主成分回归一样,每一成 分都是原变量集的线性组合,因此不能从根本上减少进入回归模型的变量数。 鉴于上述原因,本文吸取偏最小二乘回归成分提取思想,提取系统的两个主要成分,然后观察各成分中各 自变量的贡献,保留贡献最大的变量,并采用平均预测残差平方和作为变量筛选停止准则。为行文方便,将本 文提出的方法称为基于 PLS成分的变量筛选法。 2 基于PLS成分的变量筛选法 2.1 PLS成分提取方法 记因变量为y∈R“,自变量集合为x=(x。,-.-)p【),xj∈R“,且X、Y已经过标准化处理 。据 PLS回归分析 思路,在提取x中的第一个成分t。时,对t。有如下要求: a)t。应尽可能多地携带x中的变异信息; b)t。与Y的相关程度要达到最大。也就是说,t。对因变量Y要有最强的解释能力。 按照这一要求,自变量集合x的P个PLS成分可用下述算法获取: PLS成分提取算法 a)令 h=1,E0=X ,Fo=Y; b)根据E一。和Fn,计算 收稿 日期 :2003.02.17; 修回日期:2003.03.12 作者简介:李世玲(1972-- ),女,博士,助理研究员,现从事系统仿真、模式识别、小波变换理论、系统辨识等方面的 研究工作。 维普资讯 32 信 息 与 电 子 工 程 第 1卷 w:= (1) EX~ Fo _

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档