2025年金融市场数据挖掘算法考试试题及答案.docxVIP

  • 7
  • 0
  • 约7.13千字
  • 约 18页
  • 2026-04-28 发布于四川
  • 举报

2025年金融市场数据挖掘算法考试试题及答案.docx

2025年金融市场数据挖掘算法考试试题及答案

一、单项选择题(每题2分,共20分)

1.在金融市场高频交易数据挖掘中,处理毫秒级时间序列数据时,以下哪种特征工程方法最能捕捉价格波动的短期记忆效应?

A.计算日收益率的标准差

B.构建过去500ms的价格滞后项(Lags1-5)

C.提取每月第一个交易日的开盘价

D.对原始价格序列进行傅里叶变换提取低频成分

答案:B

解析:高频交易数据的短期记忆效应通常体现在极短时间窗口内的序列依赖,滞后项(Lags)能直接反映相邻时间点的关联,而日标准差(A)和月度特征(C)时间颗粒度不符,傅里叶变换(D)更适合周期性分析而非短期记忆。

2.某银行使用随机森林模型预测信用卡违约,训练集准确率92%,测试集准确率75%,最可能的原因是:

A.特征中包含未来信息(Look-aheadBias)

B.模型欠拟合

C.测试集数据量远大于训练集

D.标签分布在训练集和测试集中完全一致

答案:A

解析:训练集与测试集准确率差距过大(过拟合)的常见原因包括特征泄露(如使用违约发生后的账单数据作为预测特征),即未来信息污染;欠拟合(B)会导致两者都低;测试集数据量(C)不直接影响准确率差异;标签分布一致(D)是理想情况,不会导致差距。

3.基于金融文本数据(如研报、新闻)的情感分析中,

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档