- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
量化策略回测中的survivorshipbias与解决方法
一、生存偏差的基本概念与本质
(一)生存偏差的定义与核心内涵
生存偏差是量化策略回测中最常见的“数据选择偏差”之一,其核心逻辑可概括为:仅用“当前仍存在于市场中的资产”(即“幸存者”)的历史数据推导策略,却忽略了那些已退市、清盘或不再交易的“牺牲者”的存在。这种偏差会让回测结果只反映“幸存者”的辉煌,掩盖“牺牲者”的失败,最终导致策略的真实有效性被严重高估。
举个通俗的例子:若想测试“买低估值股票”的策略,回测时选取了当前市场上的100只低估值股票,计算它们过去五年的平均收益为15%。但事实上,五年前同样被归为“低估值”的股票中,有20只已因业绩恶化退市,这些股票的平均亏损高达-30%。若将这20只“牺牲者”加入回测,真实平均收益会降至(100×15%20×30%)/120=7.5%——整整少了一半。这就是生存偏差的本质:用“不完整的样本”得出“不真实的结论”。
在量化领域,生存偏差的表现形式多样,但本质都是“数据样本的缺失”:回测股票策略时只用当前上市的股票、回测基金策略时只用未清盘的基金、回测期货策略时只用当前活跃的合约……这些行为都会不自觉地排除“消失的资产”,而这些资产往往是策略的“业绩杀手”。
(二)生存偏差的形成机制
生存偏差的产生是“数据来源、研究者行为、市场规律”三者共同作用的结果,具体可分为三个层面:
数据提供商的默认设置
多数金融数据提供商为优化服务或降低成本,会默认只保留“当前活跃”的资产数据。比如某主流股票数据库的“全部A股”列表中,默认不显示已退市超过180天的股票;某基金数据平台的“股票型基金”分类下,不会主动展示已清盘的基金业绩。研究者若不手动调整筛选条件,很容易直接使用这些“被过滤后的样本”,从而引入生存偏差。
研究者的无意识选择
即使数据提供商提供全样本数据,研究者也可能因“思维惯性”或“简化操作”排除“消失的资产”。比如做“沪深300成分股策略”时,用当前的成分股回测过去五年的收益,而非每年年初的真实成分股列表——这会把后来被调出成分股的“牺牲者”排除在外;再比如手动筛选标的时,更倾向于选择“熟悉的、有知名度的”股票,不自觉忽略已退市的“陌生股票”。
市场的自然淘汰机制
金融市场是“优胜劣汰”的生态系统:公司会因经营不善破产、被并购或触发退市条件(如连续三年亏损);基金因规模过小(低于5000万元)或业绩不佳清盘;期货合约因到期或品种取消停止交易。这些“消失的资产”往往业绩或流动性差,其历史数据易被“选择性遗忘”。比如某2018年退市的股票,2015-2017年的年亏损率达-25%,但因已不在市场上,研究者2023年回测时很难主动想起将其加入样本。
这三个层面的因素相互叠加,让生存偏差成为量化回测中“隐蔽而顽固”的陷阱——即使研究者意识到它的存在,也可能因数据收集困难或思维惯性无法完全规避。
二、生存偏差对量化策略回测的具体影响
生存偏差对回测结果的扭曲,最终会误导策略决策。从实际案例看,其影响主要体现在三个方面:业绩高估、风险低估、策略有效性误判。
(一)策略业绩的系统性高估
生存偏差最直接的影响,是让策略的“历史收益”比真实情况更好。“消失的资产”往往业绩差——退市股票的平均亏损率通常比上市股票高3-5倍,清盘基金的平均收益率比存续基金低10-15个百分点。当这些“亏损资产”被排除在回测外时,剩下“幸存者”的平均收益会被大幅拉高。
比如某“低估值股票策略”回测时用了当前上市的100只股票,年化收益12%;但补充过去五年退市的20只股票后,年化收益降至7.8%——差异的4.2个百分点全部来自退市股的亏损。更关键的是,退市股的亏损往往集中在退市前的最后一年(比如某股票2021年亏损-40%,2022年退市),回测时漏掉它,就会少算这-40%的亏损,导致收益虚高。
(二)策略风险的严重低估
除了高估收益,生存偏差还会让策略的“风险指标”看起来更优——比如最大回撤、波动率、夏普比率(收益/风险比)。“消失的资产”往往是“风险源”:价格波动大、流动性差,甚至会出现“连续跌停”(如退市前的股票)。当这些资产被排除时,策略的“历史最大回撤”会被低估,“夏普比率”会被高估。
比如某策略回测时包含50只股票,其中5只已退市,这5只在退市前三个月平均下跌50%。若漏掉它们,策略的最大回撤会从-25%降到-15%,夏普比率从1.2升到1.8——看起来“风险更低、收益更高”,但这些极端亏损在实盘时无法避免。2020年某量化基金的实盘案例就很典型:回测时用“当前上市的500只股票”,夏普比率2.0,但实盘时因买入两只即将退市的股票,单月亏损超过15%,最终清盘。
(三)策略有效性的误判与实盘失效
生存偏差最危险的影响,是让研究者对“策略的有效性”产
您可能关注的文档
- 2025年ESG分析师认证(CESGA)考试题库(附答案和详细解析)(1217).docx
- 2025年智能家居工程师考试题库(附答案和详细解析)(1218).docx
- 2025年运动营养师考试题库(附答案和详细解析)(1224).docx
- 2026年公关策划师考试题库(附答案和详细解析)(0102).docx
- 2026年司法鉴定人考试题库(附答案和详细解析)(0108).docx
- 2026年注册投资项目分析师(CIPA)考试题库(附答案和详细解析)(0107).docx
- 2026年自然语言处理工程师考试题库(附答案和详细解析)(0102).docx
- 6600吨智利车厘子运抵天津港.docx
- GEN老板说RNG已不复存在.docx
- Python编程试卷及答案.doc
- 初中语文教学批判性思维培养与学生批判性思维能力的提升教学研究课题报告.docx
- 2025年医疗康复资管五年策略:脑机接口行业分析.docx
- 2025年光伏组件抗盐雾技术发展报告.docx
- 2025年低碳城市绿色建筑创新报告.docx
- 高中化学项目式学习评价对学生学习策略的优化研究教学研究课题报告.docx
- 劳动关系成立和终止,从劳动者和用人单位是否存在从属关系等因素判断,主张关系存在或终止的当事人需提供相应证据,举证不能则承担不利后果.pdf
- 基于移动设备的数字教育资源界面设计体验研究教学研究课题报告.docx
- 虚拟现实技术在高中物理实验创新设计中的应用研究教学研究课题报告.docx
- 初中物理教学中力学实验与数字化测量的课题报告教学研究课题报告.docx
- 绿色资管五年发展:2025年绿色交通投资报告.docx
最近下载
- 激光原理与激光技术课后习题答案及勘误表.pdf VIP
- 成都双流彭镇概念性规划.pdf VIP
- 92.2021【文旅小镇】川西古镇彭镇规划划设计-137页.pdf VIP
- (光电信息科学与工程)激光原理与技术试题及答案.doc VIP
- 西门子PCS7-CFC培训(工程师培训).pdf VIP
- PCS7工厂分级培训及CFC编程(工程师培训).pptx VIP
- 2025年医学课件-鼻肠管的护理学习.pptx VIP
- AI-Thinker安信可PB-01 PB-02系列模组二次开发指导文档(二次开发指导文档)(3).pdf
- 国家基层高血压防治管理指南2025版解读PPT课件.pptx VIP
- 东南大学附属中大医院2026年招聘备考题库及答案详解一套.docx VIP
原创力文档


文档评论(0)