2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0208).docxVIP

  • 0
  • 0
  • 约7.43千字
  • 约 11页
  • 2026-03-23 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0208).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

1.数据清洗的核心目标是?

A.去除所有异常值

B.提升后续分析/建模的质量

C.将数据转换为CSV格式

D.合并多源数据集

答案:B

解析:数据清洗的核心是通过处理缺失值、异常值、格式错误等问题,为后续分析或建模提供高质量数据,最终提升模型性能或分析结论的可靠性。选项A(去除所有异常值)错误,因部分异常值可能包含关键信息;C(格式转换)是具体操作而非目标;D(合并数据集)属于数据集成,非清洗核心目标。

2.以下哪项属于监督学习任务?

A.K-means聚类

B.主成分分析(PCA)

C.线性回归

D.关联规则挖掘

答案:C

解析:监督学习需要标签数据,目标是建立输入与输出的映射关系。线性回归是典型的监督学习任务(预测连续值)。其他选项:A(聚类)、B(降维)、D(关联规则)均为无监督学习(无标签数据,探索数据内在结构)。

3.混淆矩阵中“TP(TruePositive)”指?

A.实际正类被预测为负类

B.实际负类被预测为正类

C.实际正类被预测为正类

D.实际负类被预测为负类

答案:C

解析:混淆矩阵中,TP(真阳性)表示真实类别为正类且模型预测为正类的样本数;TN(真阴性)为真实负类且预测负类;FP(假阳性)为真实负类但预测正类;FN(假阴性)为真实正类但预测

文档评论(0)

1亿VIP精品文档

相关文档