2026年数据分析与数据挖掘多选题库年度更新版.docxVIP

  • 1
  • 0
  • 约4.78千字
  • 约 16页
  • 2026-06-07 发布于福建
  • 举报

2026年数据分析与数据挖掘多选题库年度更新版.docx

第PAGE页共NUMPAGES页

2026年数据分析与数据挖掘:多选题库年度更新版

第一部分:数据预处理与特征工程(5题,每题2分)

1.数据清洗中的缺失值处理方法有哪些?

A.删除含有缺失值的行

B.使用均值、中位数或众数填充

C.使用K最近邻(KNN)算法填充

D.插值法

E.以上都是

答案:E

解析:数据清洗中的缺失值处理方法包括删除、填充(均值/中位数/众数/插值/KNN等),因此选项E正确。

2.特征工程中,哪些属于特征选择方法?

A.主成分分析(PCA)

B.递归特征消除(RFE)

C.Lasso回归

D.决策树特征重要性排序

E.以上都是

答案:E

解析:特征选择方法包括降维技术(PCA)、包裹式方法(RFE)、嵌入式方法(Lasso回归)及基于模型的特征重要性(决策树等),因此选项E正确。

3.如何处理数据中的异常值?

A.删除异常值

B.使用Z-score或IQR方法检测

C.对异常值进行分箱处理

D.使用离群点聚类算法(如DBSCAN)

E.以上都是

答案:E

解析:异常值处理方法包括检测(Z-score/IQR)、删除、分箱或聚类处理,因此选项E正确。

4.标准化与归一化的区别是什么?

A.标准化使用均值为0,标准差为1

B.归一化将数据缩放到[0,1]区间

C.标准化适用于所有数据类型

D.归一化可

文档评论(0)

1亿VIP精品文档

相关文档