- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
通过Lasso进行回归压缩和选择分析
回归压缩以及通过Lasso选择变量
由ROBERT TIBSHIRANIT著
加拿大 多伦多大学
1994年1月接收 1995年1月修订
?
摘要
我们提出了一个估计线性模型的新方法。Lasso最小化残差平方和使得系数绝对值之和小于一个常数。由于这种约束的性质,它倾向于产生一些恰好为0的系数,从而给出了解释模型。我们的模拟研究表明,Lasso具有一些子集选择和岭回归的良好特性。它产生像子集选择一样的可以解释的模型并且展示了岭回归的稳定性。Lasso与Donoho和Johnstone近期提出的关于自适函数估计的工作有着有趣的联系。Lasso想法是相当广泛的,并且可以运用在各种统计模型中:本文简要介绍了广义的回归模型和基于树的模型的扩展。
?
关键词:二次规划;回归;压缩;子集选择
?
1.引言
考虑一般的回归情况:我们有数据,和分别是第组观测的自变量和因变量值。普通最小二乘估计(OLS)是通过残差平方和最小化得到的。有两个原因来解释为什么数据分析常常不适合用OLS估计。第一个原因是预测精度:OLS估计通常偏压较小,方差较大;预测精度有时可以通过压缩或将一些系数设置为0而提高。通过这样做,我们牺牲一点偏压以减少所预测值的方差,并且可以提高整体的预测精度。第二个原因是模型的解释。对于大批预测值,我们更愿意判断模型在一个更小的子集当中显示出来的最好的结果。
两个可以改善OLS估计的基本方法,子集选择法和岭回归都有缺陷。子集选择法提供了可解释的模型,但是由于它是一个从模型中保留或删除的离散过程变量,它可能极其易变。数据的微小变动会影响由子集选择法得出不同模型,这可以降低其预测精度。岭回归是一个系数收缩的连续的过程,并且因此更加稳定:然而,它的任何系数都不为0,因此不能给出容易解释的模型。
我们提出一个新方法,叫作Lasso,意思是最小绝对收缩和选择算法。它缩小了一些系数,并将其他的系数设置为0,从而试图保留子集选择法和岭回归的优良特性。
在第2节我们给出了Lasso的定义,并且寻找一些特例。在第3节中给出一个真实的数据例子,在第4节我们研究了预测误差与Lasso收缩参数估计的方法。在第5节简单提及Lasso中的一个贝叶斯方法。我们在第6节描述了Lasso算法。第7节是模拟研究和介绍。第8节和第9节研究了广义回归模型的拓展和其他问题。第10节讨论了Lasso软阈值的一些结论以及关系,第11节包括讨论与总结。
LASSO方法
2.1 定义
假设数据,其中为自变量,是因变量,在通常的回归建立中,我们假定要么观测值是独立的,或者对于给定的,所有的是条件独立的。我们假定标准化,且。
令,用Lasso方法的估计量定义为
对于 (1)
这里是一个调和参数。此时对所有的,有的估计是。我们可以在不失一般性的情况下假定,因此可忽略。
方程(1)的解决方案的计算是具有线性不等式约束的二次规划问题。我们将在第6节针对这个问题介绍一些高效稳定的算法。
参数控制的是应用于估计的收缩量。令为完全最小二乘估计且令。会导致模型的收缩量趋向0,且一些系数可能刚好等于0。举个例子,如果,效果会大致类似于寻找大小为的最优子集。还需要注意的是设计矩阵不一定是满秩。在第4节我们给出估计的一些基于数据的方法。
Lasso的想法来源于Breiman(1993)的一个令人刚兴趣的建议。Breiman的非负铰除法目标函数最小化形式为
使得, (2)
非负铰除法始于普通最小二乘估计,而且压缩其系数使其非负系数的和小于一个常数。在大量的模拟实验中,相对子集选择法,Breiman的非负铰除法预测误差相对较小,而且当真实模型具有较多非零系数时,在预测方面,非负铰除法和岭回归法的预测效果不相上下。
非负铰除法的缺点是其运算结果依赖于最小二乘估计的符号和数值大小。并且在存在过度拟合和变量存在高度相关情况时,由于最小二乘估计效果不好而会影响预测准确性。相比之下,Lasso则避免了非负绞除法的缺陷。
Frank和Friedman提出给标准的系数一个约束条件,这里是一个大于等于0的数;Lasso方法中。我们将在第十节对此进行简略的讨论。
2.2 正交设计案例
从标准正交设计案例中可以对收缩的本质有深入了解。设矩阵是的的矩阵。其中第行第列元素为,且假定,是单位矩阵。
方程(1)的解可以简单表示为
(3)
这里由条件来确定。有趣的是,这恰好与Donoho和Johnstone (1994)和Donoho等人(1995)在功能预测背景下应用于微波系数的函数估计提出的软收缩建议具有相同的形式。Donoho等人也在信号处理以及图像复原中指出了软收缩和最小范数惩罚矩阵之间的联系。在第十节我们会详尽的解释他们之间的联系。
在正交设计
文档评论(0)