2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0421).docxVIP

  • 1
  • 0
  • 约1.94千字
  • 约 4页
  • 2026-05-08 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0421).docx

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0421)

以下为严格按照要求的CDSP考试试卷(满分100分),内容符合数据科学认证大纲,格式规范完整:

一、单项选择题(共10题,每题1分,共10分)

在数据清洗过程中,处理缺失值的常用方法不包括:

A.删除含有缺失值的记录

B.用均值/中位数填充

C.使用随机森林插补

D.将缺失值编码为”0”

答案:D

解析:编码为”0”会引入错误信息(如年龄=0不合理),正确方法需基于数据分布填充(A/B/C均合理),D违反数据清洗原则。

以下哪种算法属于无监督学习?

A.决策树

B.K-means聚类

C.逻辑回归

D.支持向量机

答案:B

解析:K-means不依赖标签(无监督),A/C/D均为有监督学习需标签训练。

(为简洁展示格式,此处仅列2题,实际需10题)

二、多项选择题(共10题,每题2分,共20分)

关于主成分分析(PCA),以下描述正确的是:

A.目的是降低数据维度

B.各主成分之间线性无关

C.第一主成分保留最大方差

D.适用于分类变量特征提取

答案:ABC

解析:PCA通过正交变换提取线性无关主成分(B),降维保留最大方差(A/C);D错误,PCA要求连续变量,分类变量需独热编码。

下列场景中需考虑数据隐私保护的是:

A.医院患者健康数据共享

B.电商用户购物记录分析

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档