2026年数据挖掘工程师考试大纲含答案.docxVIP

  • 2
  • 0
  • 约4.53千字
  • 约 13页
  • 2026-05-16 发布于福建
  • 举报

2026年数据挖掘工程师考试大纲含答案.docx

第PAGE页共NUMPAGES页

2026年数据挖掘工程师考试大纲含答案

一、单选题(共10题,每题2分,计20分)

1.在数据预处理阶段,对于缺失值处理,以下哪种方法最适用于连续型数值特征且不引入过多偏差?

A.删除含有缺失值的样本

B.填充均值或中位数

C.使用模型预测缺失值

D.填充众数

2.假设某电商平台的用户购买行为数据中,时间戳精度到秒,若需分析用户行为周期性,以下哪种时间粒度最合适?

A.年

B.月

C.日

D.小时

3.在聚类算法中,K-means算法的主要缺点是什么?

A.对初始聚类中心敏感

B.无法处理高维数据

C.计算复杂度低

D.对噪声数据鲁棒

4.假设某城市共享单车骑行数据中,用户年龄分布为右偏态,若需进行特征工程,以下哪种方法能更好地平滑数据?

A.标准化

B.对数变换

C.均值编码

D.分箱处理

5.在逻辑回归模型中,以下哪种指标最适合评估模型在二分类问题上的性能?

A.F1分数

B.AUC

C.皮尔逊相关系数

D.决策树深度

6.假设某银行信贷数据中,特征之间存在高度相关性,以下哪种方法能有效地降低特征维度?

A.PCA

B.LDA

C.决策树

D.KNN

7.在异常检测中,若数据分布未知且样本量较大,以下哪种算法更适用?

A.LOF

B.IsolationForest

文档评论(0)

1亿VIP精品文档

相关文档