- 0
- 0
- 约2.53万字
- 约 11页
- 2026-02-27 发布于江西
- 举报
财贸研究2024.1
序列稀疏自回归方法及其在美股
做空数据分析上的应用
刘静余琴吴捷²李阳1
(1.中国科学技术大学,安徽合肥230026;2.安徽大学,安徽合肥230601)
摘要:采用序列稀疏回归的思路来处理向量自回归模型,并设计适用于大规模时间序列数据
分析的序列稀疏自回归方法。研究表明:从因子角度刻画向量自回归模型可以有效地将稀疏矩阵
估计问题分解成稀疏奇异向量的估计问题,从而极大地提高了计算效率。以1523家美股上市公司
1973年1月一2014年12月的做空数据为例,利用此方法探索公司之间的大规模做空关联网络。
研究发现:此方法可以有效地恢复股票做空份额(即某一公司的空头股份数量)与股票收益率之间
隐藏的关联网络,对于股票风险溢价研究具有一定启发意义。
关键词:向量自回归模型;关联性网络;稀疏建模;股票做空份额;大数据分析
中图分类号:F830文献标识码:A
D0I:10.19337/j.cnki.34-1093/f.2024.01.005
一、引信
高度发达的科学技术和仪器设备带来了海量的数据,如健康医疗数据、生物信息数据、经济金融数
据等。在这些数据应用中,针对响应变量和预测变量之间的大规模关联网络分析是揭示数据背后信息
的重要手段之一。例如,从用户活动推断影响网络在社交媒体营销(Gomez-Rodriguezetal.,2012)和危
机管理(Starbirdetal.,2012)中有着广泛的应用。特别地,稀疏降秩回归通过联合低秩和稀疏的结构来
表示响应变量与预测变量之间的依赖关系,从而减轻了维数的诅咒,提高了模型的可解释性,在大规模
关联分析中越来越受欢迎。
根据回归系数矩阵的恢复方式,稀疏降秩回归一般可以分为两类:一是通过不同正则化方法直接估计
回归系数矩阵(Anderson,1951;Liuetal.,2015;Gohetal.,2017;Fanetal.,2019);二是从潜在因子的角度通
法去恢复未知的系数矩阵(Chenetal.,2017;Mishraetal.,2017;Uematsuetal.,2019;Zhengetal.,2019)。相
比第一类方法,第二类方法在具有良好精度的同时还有计算快捷的优势。因此,在大规模网络数据分析
中,序列稀疏建模逐步成为近些年的主流方法。
然而,当面临带有时间信息的大规模时序数据时,如何快速且有效地进行关联性分析是个重要问
收稿日期:2022-04-05
作者简介:刘静(1984一),女,安徽霍邱人,中国科学技术大学管理学院访问学者,安徽国际商务职业学院副教授。
余琴(1997一),,女,安徽池州人,中国科学技术大学管理学院博士生。本文通讯作者。
吴捷(1994一),女,安徽合肥人,安徽大学大数据与统计学院讲师。
李阳(1994一),男,安徽合肥人,中国科学技术大学管理学院特任副研究员。
基金项目:国家自然科学基金项目“基于自适应投影方法的高维复杂数据统计分析及应用。
感谢高校优秀青年骨干教师国内访问研修项目(gxgnfx2021101)的支持。
一60一
题。本文拟采用序列稀疏自回归方法来处理向量自回归模型,设计适用于大规模时间序列数据分析的
序列稀疏自回归方法。本文的研究灵感来自著名的美股做空数据——美国Compustat
hec.unil.ch/agoyal/
月一2014年12月的200多万个观测数据。正如Rapachetal(2016)所指出的,股票做空份额是迄今为
止得到论证的股票风险溢价的最强预测因子。因此,本文希望有效地探索出这些公司之间的大规模做
空关联网络。
本文的主要贡献如下:一是通过向量自回归模型刻画做空关联网络简单易实现,且具有良好的可解
释性;二是相比传统的大规模时序数据分析方法,序列稀疏建模在保持高精度的同时具有计算简单快捷
的优势,并可以从潜在因子的角度进一步解释数据分析结果;三是通过研究美股做空关联网络,科研人
员或股票从业人员可以类似地建模A股和港股的做空数据,并为国内投资者提供一些关于股票风险溢
价的参考信息。
原创力文档

文档评论(0)