2026年高级数据分析师考试题库(附答案和详细解析)(0211).docxVIP

  • 2
  • 0
  • 约7.63千字
  • 约 11页
  • 2026-05-17 发布于上海
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0211).docx

高级数据分析师考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪种特征选择方法属于“过滤法”?

A.卡方检验

B.递归特征消除(RFE)

C.正则化(L1)

D.随机森林特征重要性

答案:A

解析:过滤法基于特征与目标变量的统计关系筛选特征(如卡方检验、相关系数);B(RFE)是包装法(基于模型效果迭代筛选);C(正则化)是嵌入法(模型训练中自动选择特征);D(随机森林特征重要性)是基于模型的嵌入法或包装法。

在假设检验中,若研究假设为“新算法的准确率显著高于旧算法”,应选择哪种检验类型?

A.双侧检验

B.单侧检验

C.卡方检验

D.方差分析(ANOVA)

答案:B

解析:单侧检验用于方向性假设(如“高于”或“低于”);双侧检验用于无方向的“是否有差异”;C(卡方检验)用于分类变量相关性;D(ANOVA)用于多组均值比较。

以下哪项是解决过拟合的常用方法?

A.增加训练数据的噪声

B.减少模型的正则化参数

C.增加模型的复杂度(如深度)

D.提前终止(EarlyStopping)

答案:D

解析:过拟合因模型对训练数据过度学习,解决方法包括正则化、增加数据、降低复杂度、提前终止等;A(增加噪声)可能加剧过拟合;B(减少正则化)会削弱约束;C(增加复杂度)会加重过拟合。

数据清洗的合理顺序是?

A.处理缺失值→检测异常值→纠正格式错误

B.

文档评论(0)

1亿VIP精品文档

相关文档