2026年高级数据分析师考试题库(附答案和详细解析)(0227).docxVIP

  • 2
  • 0
  • 约8.62千字
  • 约 12页
  • 2026-04-09 发布于江苏
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0227).docx

高级数据分析师考试试卷(总分100分)

一、单项选择题(共10题,每题1分,共10分)

在假设检验中,“拒绝真实原假设”的错误属于以下哪类?

A.α错误(第一类错误)

B.β错误(第二类错误)

C.P值显著性水平

D.置信区间偏移

答案:A

解析:假设检验中,α错误(第一类错误)是“弃真”错误(拒绝真实的原假设),β错误(第二类错误)是“取伪”错误(接受错误的原假设)。P值是观察到更极端结果的概率,置信区间用于估计参数范围,均与错误类型无关。

以下哪项是衡量分类模型对正类样本识别能力的指标?

A.准确率(Accuracy)

B.精确率(Precision)

C.召回率(Recall)

D.F1分数

答案:C

解析:召回率(Recall)=真阳性/(真阳性+假阴性),反映模型正确识别正类样本的能力;精确率反映正类预测的准确性,准确率是整体正确比例,F1是精确率与召回率的调和平均。

数据湖(DataLake)与数据仓库(DataWarehouse)的核心区别是?

A.数据存储介质不同

B.数据结构化程度不同

C.支持的查询类型不同

D.数据量大小不同

答案:B

解析:数据湖存储原始、非结构化/半结构化数据(如日志、文本),数据仓库存储高度结构化、经过清洗的业务数据(如关系型数据库表)。二者存储介质(如HDFS、云存储)和查询类型(OLAP)可能重叠,数据量

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档