2026年高级数据分析师考试题库(附答案和详细解析)(0408).docxVIP

  • 0
  • 0
  • 约1.8千字
  • 约 3页
  • 2026-05-03 发布于上海
  • 举报

2026年高级数据分析师考试题库(附答案和详细解析)(0408).docx

2026年高级数据分析师考试题库(附答案和详细解析)(0408)

高级数据分析师认证试卷

一、单项选择题(共10题,每题1分,共10分)

在时间序列分析中,ARIMA模型的“I”指的是哪种数据处理方法?

A.指数平滑

B.季节性差分

C.自回归

D.非季节性差分

答案:D

解析:ARIMA模型中”I”表示Integrated(整合),特指通过非季节性差分使非平稳序列平稳化。A项指数平滑属于预测方法,B项为季节性模型组件,C项是ARIMA中的”AR”部分。

使用SQL进行数据查询时,以下哪个函数可用于计算分位数?

A.AVG()

B.MEDIAN()

C.PERCENTILE_CONT()

D.STDEV()

答案:C

解析:PERCENTILE_CONT()是ANSISQL标准的分位数计算函数(连续分布)。A计算均值,B在部分SQL实现中可用但非标准,D计算标准差。

二、多项选择题(共10题,每题2分,共20分)

下列哪些操作会导致机器学习模型过拟合?()

A.增加训练数据量

B.使用高阶多项式特征

C.在决策树中取消最大深度限制

D.对数据做L2正则化处理

答案:BC

解析:B项高阶多项式使模型过度复杂,C项无限制的决策树会记忆噪声;A项增加数据抑制过拟合,D项L2正则化通过惩罚权重降低过拟合风险。

关于Hive和传统RDBMS的区别,正确的有()

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档