长记忆序列在金融市场中的应用.docxVIP

长记忆序列在金融市场中的应用.docx

此文档为 AI 生成,请仔细甄别后使用;此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

长记忆序列在金融市场中的应用

在金融市场摸爬滚打这些年,我常跟同行们开玩笑说:“市场是有‘记性’的,只不过这记性时短时长。”做量化分析的都知道,从股价波动到成交量变化,从波动率集群到收益率自相关,金融数据里藏着各种或明或暗的“记忆”。其中最让我着迷的,是那些“记性特别好”的长记忆序列——它们不像普通时间序列那样“转身就忘”,而是能把过去的信息以缓慢衰减的方式延续到未来。这种特性看似抽象,却实实在在影响着我们做预测、管风险、定策略的每一步。今天就跟大家好好聊聊,长记忆序列在金融市场里到底扮演着怎样的角色。

一、从“记忆”到“长记忆”:理解金融数据的时间特性

要讲长记忆序列的应用,得先弄清楚什么是“记忆”。金融时间序列的“记忆”,本质上是数据点之间的相关性随时间间隔的衰减速度。举个简单例子:如果今天的股价涨了,明天的股价也倾向于涨,后天可能还有点影响,但到了一周后基本没关联了——这种“记性”来得快去得快,就是短记忆。而长记忆序列就像一位老人,年轻时的经历能影响到暮年:今天的波动率异常高,可能下周、下个月甚至更久之后,波动率依然会比正常水平略高,只不过这种影响会以非常缓慢的速度减弱。

1.1短记忆与长记忆的数学分界

从数学定义看,短记忆过程(如常见的ARMA模型)的自相关函数(ACF)会以指数速度衰减,就像扔一块石头到水里,涟漪很快消失;而长记忆过程的自相关函数则以双曲速度衰减(即ACF(k)≈C·k^(2d-1),其中d是记忆参数,0d0.5),衰减速度慢到几乎“拖尾”。这种差异决定了两类模型对历史信息的利用方式——短记忆模型只需要最近几期数据就能做预测,长记忆模型却要“翻旧账”,把更早的数据也纳入考虑。

举个我当年做实习时的例子:带我的老师让我用ARMA模型预测某股票的日收益率,结果连续三周预测误差都很大。后来他指着自相关图说:“你看,20天前的自相关系数还有0.15,这哪是短记忆能解释的?”后来我们改用长记忆模型(ARFIMA),把d参数估计出来,预测效果立马提升了20%。这让我第一次直观感受到,区分短记忆和长记忆对实际建模有多重要。

1.2金融市场中的长记忆“痕迹”

金融数据里的长记忆现象并不罕见。最早的研究可以追溯到20世纪60年代,曼德博(Mandelbrot)分析棉花价格时就发现,收益率的平方(代表波动率)存在长期自相关。后来学者们用更严谨的方法验证:股票市场的波动率、外汇的汇率波动、商品期货的成交量,甚至加密货币的价格波动,都普遍存在长记忆特征。

比如,2015年某段时间A股剧烈震荡后,虽然指数很快企稳,但后续几个月里,个股的波动率始终比历史均值高10%-15%——这种“余震”效应用短记忆模型很难捕捉,但长记忆模型能通过d参数量化这种缓慢衰减的影响。再比如高频交易中,1分钟级别的成交量数据,其自相关往往能延续到几十分钟甚至几小时,这种“延迟反应”同样是长记忆的典型表现。

二、如何识别长记忆?从经典方法到争议挑战

知道了长记忆的重要性,接下来的问题是:怎么判断一组金融数据有没有长记忆?这就需要用到各种实证检验方法。这些方法各有优劣,实际应用中我常开玩笑说“没有最好的,只有最适合的”。

2.1经典方法:R/S分析与改进

最广为人知的方法是R/S分析(重标极差分析),由赫斯特(Hurst)在研究尼罗河水位时提出。简单来说,R/S统计量衡量的是序列的波动范围与时间跨度的关系。对于长记忆序列,R/S随时间跨度n的增长速度会比短记忆序列更快,具体表现为R/S≈n^H,其中H是赫斯特指数(0.5H1时存在长记忆)。

我刚工作时,第一次用R/S分析检验某指数的波动率序列,计算出H=0.68,明显大于0.5,说明存在长记忆。但后来发现,R/S分析对短期相关性和结构突变很敏感——比如数据中突然出现一次股灾,可能会让H值虚高。后来学者们改进出“修正R/S分析”,通过去除短期自相关的影响,结果更可靠了。

2.2频域方法:GPH检验与分数差分参数估计

另一种常用方法是频域检验,最典型的是GPH检验(Geweke-Porter-Hudak)。这种方法通过分析序列的谱密度函数在低频处的行为来估计记忆参数d。理论上,长记忆序列的谱密度在低频处会趋向于无穷大(谱密度≈f^(-2d),f→0),而短记忆序列的谱密度在低频处是有限的。通过对低频部分的对数谱密度做回归,就能估计出d值。

我在做债券市场波动率研究时,用GPH方法估计d=0.32,说明存在显著的长记忆。不过频域方法需要较多的数据点(通常要求样本量500),对于高频数据(比如秒级交易数据)倒是适用,但对于某些新兴市场的低频数据(比如日度数据不足300个),结果可能不稳定。

2.3争议:长记忆还是结构突变?

需要特别说明的是,长记忆的存在性一直有争议。有学者提出,所谓的“长记忆”可能只是

文档评论(0)

level来福儿 + 关注
实名认证
文档贡献者

好好学习

1亿VIP精品文档

相关文档