“学海拾珠”系列之二百：数据挖掘的修正与基金的业绩表现.docx

下载文档

14
0
约1.15万字
约 13页
2024-09-06 发布于北京
举报
版权申诉
保障服务

“学海拾珠”系列之二百：数据挖掘的修正与基金的业绩表现.docx

1、本文档共13页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

正文目录

引言 4

数据挖掘的修正 5

基金业绩模型 5

数据挖掘修正的测试 7

数据与方差的估计 8

业绩持续性分析 11

7 总结 14

风险提示： 14

图表目录

图表1文章框架 4

图表2均值、标准差、年化夏普、TREYNOR比率（2003年11月~2023年10月） 9

图表3共同基金描述性统计（单位：%） 9

图表4平均年化夏普和TREYNOR比率以及标准差 10

图表5估测的方差与零假设检验 10

图表612、36、60个评估月下的FDP对比 11

图表7过去12个月收益率的预测能力IC 11

图表8过去36个月收益率的预测能力IC 12

图表9信息系数IC之差（不同过去评估期与未来持有期） 12

图表10多空收益之差 13

图表11市场的序列相关性与基金的偏度 13

引言

图表1文章框架

资料来源：

截至2022年底，美国独立的共同基金数量已激增至7000个，每个基金由不同的基金经理管理。此外，美国注册投资顾问（RIA）的数量也呈现前所未有的激增，总数高达15,144名。这些顾问能够长久成功的关键因素在于他们能够从众多基金中识别出表现最佳的基金。显然，基金经理在选股方面的技能存在很大差异。然而，关于基金过去的成功多大程度上归功于运气，以及过去的成功是否能可靠地预测其未来表现，仍然是一个有争议的问题。

多种指标都可以来衡量投资组合的表现，包括算术平均值、几何回报率和风险调整后的回报率。早期的研究者，如特雷诺（Treynor，1965年）、夏普（Sharpe，1966年）和詹森（Jensen，1968年），分别引入了特雷诺比率、夏普比率和詹森阿尔法作为业绩指标。这些业绩指标提供了点估计值，即特定时期内投资组合表现的快照。

任何普通最小二乘法（OLS）程序包的基本要素，即平均收益和阿尔法（alpha）的估计误差，有助于确认点估计的精确性。在2002年的一篇文章中，Lo利用汉森

（Hansen）于1982年提出的广义矩估计（GMM）方法，推导出夏普比率的估计误差，而Guerard、Wang和Xu于2019年进一步扩展了GMM的应用范围，推导出特雷诺比率的估计误差。

一旦得出这些估计误差，就可以计算t值，即用于评估结果数据集置信水平的统计标准。t值能够验证或反驳与这些绩效指标相关的零假设，从而为做出明智的投资

决策提供坚实的基础。

然而，考虑到基金的数量众多，仅对单个t统计量进行分析可能会高估有能力基金经理的比例。这一点在以下发现中得到了证实：基于5年、10年和20年的回报数据，分别有20%、30%和50%的基金经理被证明是有能力的——这显然是一种高估。

Fama和French在2010年进行的一项研究强化了这一点，他们指出，只有2%的基金经理表现出了统计学上有效的选股技能。这种技能是通过三因子或四因子模型生成的阿尔法值来衡量的。这突显了采用超越传统t统计量的高级统计技术来完善基金选择过程的必要性。

文献应用并扩展了Markowitz和Xu于1994年提出的用于评估回测模型的数据挖掘校正技术，以研究基金技能的变化。模型能够基于过去的回报来计算共同基金的伪发现率（falsediscoveryrate）。它还能够计算过去回报对未来回报的横截面预期预测能力。在大多数情况下，经验信息系数（ICs）与预期ICs在统计学上没有显著差异，无法确认或拒绝预期信息系数随过去和未来回报增加而变化的单调性。

数据挖掘的修正

1964年引入的CRSP数据库包含从1925年12月起所有纽约证券交易所上市股票的数据，标准普尔（StandardPoor）在1962年通过推出其全面的Compustat数据库，进一步丰富了数据的可用性。利用这两个数据库，可以轻松找到并仔细研究无数的资本资产定价模型，无论是线性的还是非线性的。这些新发现的资产定价模型的可靠性转化为对未来回报的预测，需要进行细致的测试和验证。Lopez（2018年）观察到，大多数基于机器学习工具的基金都会失败，并列出了10个原因。著名研究人员Arnott、Harvey和Markowitz（2018年）提出了一个结构化回测框架，以提高准确发现风险因素的可能性。

该框架涵盖七个广泛的类别，其中第二个类别侧重于多重测试和统计方法。在这里，重点是跟踪所有已进行的测试并执行多重均值测试，以确保这些资产定价模型的有效性。然而，基金经理仍在努力判断这些新发现模型的卓越表现是运气因素的结果，还是新风险因子的识别。

为了增强对报告业绩的判断信