2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0513).docxVIP

  • 2
  • 0
  • 约6.04千字
  • 约 7页
  • 2026-06-05 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0513).docx

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0513)

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

下列哪个不是大数据的V特性?A.体量大(Volume)B.速度快(Velocity)C.多样性(Variety)D.可靠性(Variability)答案:D解析:大数据的V特性包括体量大(Volume)、速度快(Velocity)、多样性(Variety)、价值密度低(Value)和真实性(True)。选项D“可靠性”不属于大数据特性。

在数据预处理阶段,以下哪项技术主要用于处理缺失值?A.数据归一化B.特征编码C.插值法D.主成分分析答案:C解析:插值法(如均值插值、KNN插值)是处理缺失值常用技术。数据归一化用于尺度调整,特征编码用于类别特征量化,主成分分析用于降维。

下列哪种算法属于监督学习?A.K-means聚类B.决策树C.PCA降维D.DBSCAN聚类答案:B解析:监督学习需要训练数据带有标签,决策树通过标签数据进行分类或回归。K-means和DBSCAN属于无监督学习,PCA是降维方法。

交叉验证主要用于解决什么问题?A.数据过拟合B.样本不均衡C.模型泛化能力评估D.特征选择答案:C解析:交叉验证通过多次数据分割验证模型泛化

文档评论(0)

1亿VIP精品文档

相关文档