2026年高级数据分析师考试题库(附答案和详细解析)(0310).docxVIP

  • 1
  • 0
  • 约7.72千字
  • 约 11页
  • 2026-03-24 发布于上海
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0310).docx

高级数据分析师考试试卷(总分100分)

一、单项选择题(共10题,每题1分,共10分)

以下哪项不属于数据质量评估的核心维度?

A.准确性

B.完整性

C.多样性

D.一致性

答案:C

解析:数据质量的核心维度包括准确性(数据与真实值的匹配程度)、完整性(关键字段无缺失)、一致性(跨表/系统的逻辑统一)、及时性(更新频率满足需求)和唯一性(无重复记录)。“多样性”描述数据类型的丰富度,不属于质量评估维度。

为解决模型过拟合问题,以下最有效的方法是?

A.增加训练数据量

B.减少特征数量

C.提高学习率

D.增加模型层数

答案:A

解析:过拟合的本质是模型对训练数据的噪声过度学习。增加训练数据量可提升模型泛化能力(正确);减少特征数量可能导致欠拟合(错误);提高学习率会影响收敛速度而非过拟合(错误);增加模型层数会加剧过拟合(错误)。

在二分类问题中,若真实正类为100例,模型预测正类为80例且其中60例正确,则精确率(Precision)为?

A.60%

B.75%

C.60/100=60%

D.80/100=80%

答案:B

解析:精确率=正确预测的正类数/预测为正类的总数=60/80=75%。选项A误将分母作为真实正类数(召回率计算方式),C和D均混淆了分子分母定义。

以下哪项属于特征工程中的“特征提取”操作?

A.对年龄字段进行分箱(如0-18岁、1

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档