2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0525).docxVIP

  • 0
  • 0
  • 约4.71千字
  • 约 6页
  • 2026-06-30 发布于上海
  • 举报

2026年数据科学专业认证(CDSP)考试题库(附答案和详细解析)(0525).docx

数据科学专业认证(CDSP)

一、单项选择题(共10题,每题1分,共10分)

以下哪项不是大数据的4V特征?A.体量大(Volume)B.速度快(Speed)C.多样性(Variety)D.可靠性(Reliability)答案:D解析:大数据的4V特征包括体量大、速度快、多样性、价值密度低,可靠性不属于其核心特征。

在数据预处理阶段,以下哪项技术主要用于处理缺失值?A.数据标准化B.数据降维C.插值法D.数据采样答案:C解析:插值法是处理缺失值的常用技术,其他选项分别用于数据变换、特征工程和数据量控制。

以下哪种算法属于监督学习?A.K-means聚类B.主成分分析C.决策树D.自组织映射答案:C解析:决策树是分类和回归任务中常用的监督学习算法,其余选项均属于无监督学习。

以下哪个指标最适合评估分类模型的泛化能力?A.准确率B.召回率C.F1分数D.AUC答案:D解析:AUC(ROC曲线下面积)能综合评估模型在不同阈值下的性能,更适合泛化能力评估。

以下哪种数据库最适合存储半结构化数据?A.关系型数据库B.NoSQL数据库C.事务型数据库D.搜索引擎数据库答案:B解析:NoSQL数据库(如MongoDB)设计灵活,适合存储JSON等半结构化数据。

以下哪个不是特征工程的主要方法?A

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档