2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0511).docxVIP

  • 2
  • 0
  • 约4.75千字
  • 约 6页
  • 2026-05-18 发布于江苏
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0511).docx

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0511)

数据科学专业认证(CDSP)考试试卷

一、单项选择题(共10题,每题1分,共10分)

在数据预处理阶段,以下哪项技术主要用于处理缺失值?A.数据归一化B.数据采样C.插值法D.特征编码答案:C解析:插值法(C)是处理缺失值的常用技术,通过已知数据推测缺失值。数据归一化(A)用于特征缩放;数据采样(B)用于数据量调整;特征编码(D)用于类别特征量化。正确选项C直接针对缺失值处理。

以下哪种模型属于监督学习?A.聚类分析B.主成分分析C.决策树D.神经网络答案:C解析:决策树(C)通过训练数据学习预测规则,属于监督学习。聚类分析(A)和主成分分析(B)是无监督学习;神经网络(D)可应用于监督/无监督学习,但决策树是典型的监督学习模型。

交叉验证的主要目的是?A.减少过拟合B.提高模型泛化能力C.增加模型参数D.缩短训练时间答案:B解析:交叉验证通过多次数据分割评估模型,确保泛化能力(B)。过拟合(A)是模型问题而非验证目的;参数调整(C)和训练时间(D)与验证功能无关。

以下哪个指标适用于评估分类模型的平衡性?A.准确率B.F1分数C.AUCD.RMSE答案:B解析:F1分数(B)是精确率和召回率的调和平均,适用于类别不平衡场景

文档评论(0)

1亿VIP精品文档

相关文档