2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0503).docxVIP

  • 2
  • 0
  • 约6.13千字
  • 约 9页
  • 2026-05-21 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0503).docx

CDSP数据科学专业认证考试试卷

一、单项选择题(共10题,每题1分,共10分)

1.在数据科学中,以下哪个算法主要用于分类问题?

A.K-means聚类是一种无监督学习方法

B.决策树可以用于分类和回归任务

C.主成分分析(PCA)用于降维和可视化

D.Apriori算法用于关联规则挖掘

答案:B

解析:决策树是一种监督学习算法,常用于分类问题(如预测类别标签)。错误选项分析:A是聚类算法,属于无监督学习;C是降维方法,不直接用于分类;D是关联规则挖掘算法,用于频繁项集发现。

在Python的pandas库中,以下哪个函数用于填充缺失值?

A..fillna()

B..dropna()

C..groupby()

D..merge()

答案:A

解析:.fillna()用于填充缺失值(如用均值或特定值替换空值)。错误选项分析:B用于删除缺失值行;C用于分组操作;D用于合并数据集,都不是填充缺失值的核心函数。

在统计学中,假设检验的p值小于显著性水平(α=0.05)表示什么?

A.拒绝备择假设

B.接受零假设

C.拒绝零假设

D.检验无效

答案:C

解析:p值小于α时拒绝零假设,表明有显著证据支持备择假设。错误选项分析:A错误,因为拒绝零假设等价于支持备择假设;B错误,因为小p值表示拒绝零假设;D错误,p值过小反而增强检验有效性。

大数据处理框架Hadoop

文档评论(0)

1亿VIP精品文档

相关文档