2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0522).docxVIP

  • 4
  • 0
  • 约4.68千字
  • 约 6页
  • 2026-06-15 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0522).docx

数据科学专业认证(CDSP)

一、单项选择题(共10题,每题1分,共10分)

在数据预处理阶段,以下哪项技术主要用于处理缺失值?A.数据规范化B.数据集成C.数据清洗D.特征选择答案:C解析:数据清洗(C)是处理缺失值、异常值和重复值的过程,符合题意。数据规范化(A)是调整数据范围;数据集成(B)是合并多个数据源;特征选择(D)是选择重要特征,均不直接处理缺失值。

以下哪种算法属于监督学习?A.K-means聚类B.主成分分析C.决策树D.系统聚类答案:C解析:决策树(C)是典型的监督学习算法,需要训练数据学习映射关系。K-means(A)和系统聚类(D)属于无监督学习;主成分分析(B)是降维技术,不属于学习算法。

在交叉验证中,k折交叉验证通常选择k的值为?A.2B.5或10C.20D.50答案:B解析:k折交叉验证常用k=5或10,平衡计算效率和模型评估的稳定性。k过小(如A)误差大,过大(如C/D)计算成本高。

以下哪个指标最适合评估分类模型的性能?A.决定系数(R2)B.均方误差(MSE)C.准确率D.协方差答案:C解析:准确率(C)是分类模型的核心指标。决定系数(A)和均方误差(B)用于回归模型;协方差(D)是统计概念,不用于模型评估。

以下哪种数据库系统最适合存储时间序列数据?A.关系型

文档评论(0)

1亿VIP精品文档

相关文档