2026年数据分析师数据挖掘能力考核含答案.docxVIP

  • 0
  • 0
  • 约4.09千字
  • 约 12页
  • 2026-03-24 发布于福建
  • 举报

2026年数据分析师数据挖掘能力考核含答案.docx

第PAGE页共NUMPAGES页

2026年数据分析师数据挖掘能力考核含答案

一、选择题(共10题,每题2分,合计20分)

1.在进行数据预处理时,以下哪项技术最适合处理缺失值?

A.回归填充

B.插值法

C.删除缺失值

D.均值/中位数填充

2.以下哪种算法属于监督学习中的分类算法?

A.K-means聚类

B.决策树

C.PCA降维

D.Apriori关联规则

3.在特征工程中,特征交叉通常指什么?

A.特征缩放

B.特征合并或组合

C.特征选择

D.特征编码

4.以下哪个指标最适合评估分类模型的泛化能力?

A.准确率

B.AUC

C.过拟合率

D.决策树深度

5.在时间序列分析中,ARIMA模型主要解决什么问题?

A.异常检测

B.趋势预测

C.分类问题

D.关联规则挖掘

6.以下哪种方法不属于集成学习?

A.随机森林

B.AdaBoost

C.XGBoost

D.朴素贝叶斯

7.在数据挖掘中,过拟合通常由什么原因导致?

A.样本量不足

B.特征维度过高

C.模型复杂度过高

D.数据噪声过大

8.以下哪种距离度量适用于高维数据?

A.欧氏距离

B.曼哈顿距离

C.余弦相似度

D.Minkowski距离

9.在关联规则挖掘中,提升度(Lift)衡量什么?

A.规则的频率

B.规则

文档评论(0)

1亿VIP精品文档

相关文档