2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0119).docxVIP

  • 0
  • 0
  • 约7.38千字
  • 约 10页
  • 2026-03-27 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0119).docx

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

以下关于数据清洗中缺失值处理的描述,正确的是?

A.缺失值占比超过50%时,必须直接删除该特征

B.对偏态分布的数值型数据,均值填充比中位数填充更合理

C.时间序列数据的缺失值可采用线性插值法处理

D.类别型特征的缺失值只能用众数填充

答案:C

解析:A错误,缺失值占比过高时需综合评估特征重要性,可能选择保留或构造新特征;B错误,偏态分布数据用中位数更能反映集中趋势;C正确,时间序列数据可通过插值法(如线性、多项式插值)利用时序相关性填充;D错误,类别型特征缺失值还可标记为“未知”等新类别。

以下统计量中,用于衡量数据离散程度的是?

A.中位数

B.方差

C.分位数

D.众数

答案:B

解析:A(中位数)、C(分位数)、D(众数)均衡量数据集中趋势;B(方差)通过计算各数据与均值差的平方和的均值,反映数据离散程度。

以下机器学习算法中,属于监督学习的是?

A.K-means聚类

B.主成分分析(PCA)

C.逻辑回归

D.关联规则挖掘(Apriori)

答案:C

解析:监督学习需要标签数据,目标是预测或分类。C(逻辑回归)用于二分类,属于监督学习;A(聚类)、B(降维)、D(关联规则)均为无监督学习。

SQL中,用于合并两个表中满足条件的行的操作是?

A.SELECT

B

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档