2026年高级统计师统计实务大数据建模应用试卷(含答案).docxVIP

  • 2
  • 0
  • 约6.77千字
  • 约 21页
  • 2026-06-16 发布于河南
  • 举报

2026年高级统计师统计实务大数据建模应用试卷(含答案).docx

2026年高级统计师统计实务大数据建模应用试卷(含答案)

一、单项选择题(共10题,每题2分,共20分。每题只有1个正确答案,错选、不选均不得分)

1.某地级市统计局整合全市1.2亿条居民消费交易大数据开展社零总额测算,数据中存在12%的交易记录缺失“商户所属行业”字段,且该字段为建模核心特征,该缺失值最适宜的处理方法是()

A.直接删除缺失记录

B.用同商户其他记录的行业值填充

C.用整体行业分布随机填充

D.用交易金额中位数对应的行业值填充

2.统计大数据建模中进行特征选择时,以下属于过滤法特征选择指标的是()

A.决策树特征重要性

B.皮尔逊相关系数

C.L1正则化系数

D.交叉验证AUC变化率

3.针对全国31个省份2018-2025年的季度失业率大数据面板,要开展失业率短期预测,以下模型中适配性最高的是()

A.全局ARIMA模型

B.长短期记忆网络(LSTM)

C.多元线性回归

D.朴素贝叶斯模型

4.依据《统计法》及大数据统计应用相关规范,以下不属于统计部门对外提供大数据建模成果的禁止性情形的是()

A.提供可识别单个统计调查对象身份的成果

B.提供未脱敏的微观样本建模参数

C.提供经过汇总脱敏的行业平均产出水平

D.提供未经过质量审核的预测类成果

5.以下关于大数据建模与传统统计建模的核心差异表述正确的是(

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档