- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Lasso在高维时间序列建模中的应用
一、引言:高维时间序列的挑战与Lasso的出现背景
在我刚入行做量化分析的那几年,最头疼的问题不是模型复杂,而是“变量太多”。记得有次接手一个宏观经济预测项目,客户给了187个月度指标——从工业增加值到消费者信心指数,从国际大宗商品价格到国内货币供应量,变量数量比样本量(120个月)还多。用传统线性回归跑出来的结果,系数估计值像坐过山车,今天显著的变量明天就不显著,预测效果更是惨不忍睹。这让我第一次深刻体会到:当时间序列进入“高维时代”,传统方法真的“玩不转”了。
正是在这样的背景下,Lasso(LeastAbsoluteShrinkageandSelectionOperator)走进了我们的视野。这个诞生于20世纪90年代的统计方法,原本是为解决高维回归问题设计的,却在时间序列领域展现出惊人的适配性。它像一把“智能筛子”,既能剔除冗余变量,又能保持模型的预测能力,逐渐成为高维时间序列建模的“标配工具”。接下来,我将从高维时间序列的特征出发,结合实际案例,详细拆解Lasso的应用逻辑与价值。
二、高维时间序列的核心特征与传统方法的局限
2.1高维时间序列的定义与典型场景
所谓“高维时间序列”,简单说就是“变量多、样本少”。这里的“高维”没有严格的数学定义,但实际中当变量数p接近甚至超过样本量n(比如p/n0.5)时,就可以归为高维范畴。这类数据在金融、经济、生物信息等领域极为常见:
金融市场:多因子模型中,常见的风险因子可能包括价值、成长、动量、波动率、流动性等大类,每类又细分多个指标(如PE、PB、ROE、12个月收益率、Amihud非流动性指标等),随便一数就是几十个变量;
宏观经济:政策制定者需要跟踪的指标覆盖生产(工业增加值)、需求(社会消费品零售)、价格(CPI、PPI)、货币(M2、社融)、外部(出口额、汇率)等维度,省级数据可能有上百个变量;
科技金融:互联网平台的用户行为数据(点击量、停留时长、交易频率)按小时甚至分钟采样,时间维度密集,变量维度也随着用户分群(新客、老客、高净值)不断扩展。
这些数据有个共同特点:变量之间往往存在强相关性(比如M2增速与社融增量高度相关),时间维度上又有自相关性(今天的股价受昨天影响),传统建模方法的“短板”被无限放大。
2.2传统建模方法的困境:多重共线性与维度灾难
面对高维时间序列,最直观的想法是用普通最小二乘法(OLS)。但稍微一算就会发现问题:OLS要求设计矩阵X满秩,而高维下X的列数p行数n,矩阵X’X必然不可逆,根本无法求解。即使pn,当变量间存在多重共线性(比如相关系数超过0.8),X’X的行列式接近0,系数估计的方差会急剧增大,导致“差之毫厘,谬以千里”——稍微换个样本期,系数符号可能都变了。
那用逐步回归(StepwiseRegression)筛选变量呢?我早期试过,结果更糟。逐步回归依赖F检验的显著性,但高维下变量间的复杂关联会让显著性检验“失真”,容易漏掉重要变量或选入噪声变量。更麻烦的是,它本质是“贪心算法”,一旦前期选错变量,后续调整的空间很小。比如在预测房价的时间序列中,若第一步错误地剔除了“M2增速”,后续可能永远无法找回这个关键变量。
再看信息准则(如AIC、BIC),理论上能权衡模型复杂度与拟合优度,但高维下p可能达到几百甚至上千,计算所有可能的子集模型(2^p种组合)完全不现实。我曾用BIC尝试筛选50个变量,程序跑了三天都没出结果,最后只能放弃。
这些困境倒逼学术界和业界寻找新方法,Lasso正是在这样的背景下“脱颖而出”。它不需要遍历所有变量组合,就能同时完成变量选择和参数估计,完美契合高维时间序列的建模需求。
三、Lasso的原理适配性:从正则化到变量选择的跨越
3.1Lasso的数学本质:L1正则化下的优化问题
要理解Lasso,得先从正则化说起。正则化的核心思想是“给模型套上紧箍咒”,防止它过度拟合数据。传统的岭回归(RidgeRegression)用的是L2正则化,目标函数是:
[^{Ridge}=_{}{|y-X|_2^2+||_2^2}]
这里的第二项是L2惩罚项,λ是惩罚强度。L2正则化会让所有系数向0收缩,但不会让任何一个系数严格为0,因此无法实现变量选择——即使某个变量无关,它的系数也只是趋近于0,不会被“踢”出模型。
Lasso则用L1正则化替代L2,目标函数变为:
[^{Lasso}=_{}{|y-X|_2^2+||_1}]
L1惩罚项((||_1=|_j|))的几何意义是在参数空间中画一个菱形(L1球),而损失函数的等高线是椭圆。当两者相切时,切点往往出现在坐标轴上(即某个β_j=0),这就实现了“自动
您可能关注的文档
- 2025年保荐代表人资格考试考试题库(附答案和详细解析)(0912).docx
- 2025年信用管理师考试题库(附答案和详细解析)(0913).docx
- 2025年健康管理师考试题库(附答案和详细解析)(0913).docx
- 2025年影视后期制作师考试题库(附答案和详细解析)(0912).docx
- 2025年心理健康指导师考试题库(附答案和详细解析)(0907).docx
- 2025年数字化转型师考试题库(附答案和详细解析)(0907).docx
- 2025年数据可视化设计师考试题库(附答案和详细解析)(0910).docx
- 2025年智慧教育工程师考试题库(附答案和详细解析)(0913).docx
- 2025年注册建筑师考试题库(附答案和详细解析)(0907).docx
- 2025年注册投资项目分析师(CIPA)考试题库(附答案和详细解析)(0910).docx
文档评论(0)