2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0501).docxVIP

  • 1
  • 0
  • 约1.92千字
  • 约 3页
  • 2026-06-02 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0501).docx

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0501)

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

1.在数据清洗过程中,处理缺失值的常用方法不包括以下哪种?

A.用均值或中位数填充

B.直接删除含缺失值的记录

C.使用机器学习模型预测填补

D.将缺失值替换为0

答案:D

解析:选项D错误,无依据替换为0会扭曲数据分布。正确做法应为A、B、C(如数值型用均值填充),B在缺失比例低时可用。

随机森林算法的核心思想基于:

A.单一决策树优化

B.特征空间划分

C.多模型集成与投票机制

D.线性组合预测

答案:C

解析:随机森林通过构建多个决策树并汇总结果(Bagging)提升精度。A仅涉及基础组件,B是决策树原理,D属于线性模型范畴。

…(此处省略8题,下同)…

二、多项选择题(共10题,每题2分,共20分)

1.下列哪些属于监督学习任务?(至少两个正确)

A.聚类分析

B.线性回归预测房价

C.K-means用户分群

D.逻辑回归检测信用卡欺诈

答案:BD

解析:B、D需要标签数据(房价/欺诈标签)。A、C无标签属于无监督学习,C为典型聚类算法。

在特征工程中,可能引发过拟合的操作包括:

A.对测试集进行标准化

B.基于全体数据选择特征

C.使用10折交叉验证调参

D.创

文档评论(0)

1亿VIP精品文档

相关文档