2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0202).docxVIP

  • 1
  • 0
  • 约6.89千字
  • 约 11页
  • 2026-04-22 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0202).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下哪项是处理数据集中缺失值的常用方法?

A.直接删除包含缺失值的整行

B.用数据集的最大值填充

C.将缺失值标记为“未知”后保留

D.对所有缺失值进行线性回归预测

答案:A

解析:处理缺失值的常用方法包括删除法(删除含缺失值的行/列)、插补法(均值/中位数填充、回归预测等)、保留法(标记为特殊值)。选项B错误,因最大值可能引入异常值;选项C是保留法的一种,但并非“常用”;选项D属于插补法的复杂形式,但不如直接删除常用。因此最合理的是A。

描述数据集中趋势的统计量是?

A.标准差

B.中位数

C.方差

D.偏度

答案:B

解析:集中趋势统计量包括均值、中位数、众数;离散程度统计量包括标准差、方差;偏度描述分布形态。因此选B。

以下属于监督学习算法的是?

A.K-means聚类

B.主成分分析(PCA)

C.支持向量机(SVM)

D.关联规则挖掘

答案:C

解析:监督学习需要标签数据(如分类、回归),SVM用于分类/回归;无监督学习无标签(如K-means聚类、PCA降维、关联规则)。因此选C。

数据可视化中,用于展示两个连续变量相关性的最佳图表是?

A.柱状图

B.散点图

C.箱线图

D.饼图

答案:B

解析:散点图通过点的分布展示两个连续变量的相关关系;柱状图用于

文档评论(0)

1亿VIP精品文档

相关文档