2026年高级数据分析师考试题库(附答案和详细解析)(0305).docxVIP

  • 1
  • 0
  • 约8.21千字
  • 约 12页
  • 2026-03-18 发布于江苏
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0305).docx

高级数据分析师考试试卷

一、单项选择题(共10题,每题1分,共10分)

在特征工程中,IV(信息价值)值主要用于衡量以下哪项指标?

A.特征与目标变量的线性相关性

B.特征的缺失值比例

C.特征对目标变量的预测能力

D.特征的离散化程度

答案:C

解析:IV值(InformationValue)是评估特征预测能力的核心指标,取值范围[0,∞),通常IV0.5表示特征预测能力很强(C正确)。线性相关性由皮尔逊系数衡量(A错误);缺失值比例是数据质量指标(B错误);离散化程度通过分箱数量等指标衡量(D错误)。

A/B测试中,若原假设为“实验组与对照组无差异”,当p值=0.03时应如何结论?

A.拒绝原假设,认为存在显著差异

B.接受原假设,认为无显著差异

C.需增大样本量后重新测试

D.差异具有实际业务显著性

答案:A

解析:统计学中,p值小于显著性水平(通常0.05)时拒绝原假设,认为存在统计显著性差异(A正确)。“接受原假设”表述不严谨(B错误);p值已满足标准无需增大样本(C错误);统计显著≠实际显著(D错误)。

时间序列预测中,以下哪种模型更适合处理具有长期依赖关系的序列?

A.ARIMA

B.SARIMA

C.LSTM

D.指数平滑法

答案:C

解析:LSTM(长短期记忆网络)通过门控机制捕捉长期依赖关系,适合复杂时间序列(C正确)。ARIMA/S

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档