- 0
- 0
- 约1.88万字
- 约 29页
- 2026-07-03 发布于江西
- 举报
金融行业金融科技部数据分析师量化策略回测手册
第1章数据准备
1.1数据源选择与获取
金融科技部的量化策略回测,数据源的选择绝非小事。错误的选源或低劣的数据,足以让最精妙的策略在回测中沦为纸上谈兵。实践中,高频交易策略对tick级数据的依赖程度,远超中低频策略对日线数据的依赖。以波动率套利策略为例,若tick数据存在延迟或错漏,1ms级别的延迟可能导致信号错失,而5%的数据缺失率可能直接让回测结果偏差超过20%。因此,选源时需考虑数据的时效性、完整性、准确性和成本效益。
理想的选源组合通常包含三类数据:基础行情数据(OHLCV及衍生指标)、市场微观结构数据(订单簿、交易匹配数据),以及宏观因子数据(如利率、汇率、宏观数据)。例如,回测波动率交易策略时,VIX指数、FedFunds现货利率期货等宏观数据,往往比单纯的OHLCV数据能提供更可靠的预测维度。但数据源的选取绝非越多越好,需要基于策略逻辑进行精准匹配。高频策略需要低延迟的交易所直投数据,而机器学习策略可能更需要经过统计清洗后的多因子数据集。
获取渠道上,商业数据供应商(如Bloomberg、Refinitiv)提供的数据质量有保障,但成本高昂。交易所数据直投虽原始但可能需要定制化开发,而GitHub等社区的开源数据集适合早期原型验证,但需严格核查其合规性和准确性。合规性审查是重中之重——
原创力文档

文档评论(0)