2026年数据分析师专业能力认证试题及答案.docxVIP

  • 0
  • 0
  • 约1.11万字
  • 约 27页
  • 2026-02-12 发布于四川
  • 举报

2026年数据分析师专业能力认证试题及答案.docx

2026年数据分析师专业能力认证试题及答案

一、单项选择题(每题2分,共30分)

1.2026年某电商平台“618”大促期间,用户从浏览到支付的转化率为3.2%,若当日UV为1800万,支付用户数最接近

A.57.6万?B.57.8万?C.58.0万?D.58.2万

答案:B

解析:1800×3.2%=57.6,四舍五入后57.8万。

2.在Python3.12中,对DataFramedf使用df.groupby(city)[sales].transform(mean)返回的对象行数与df相比

A.相同?B.减少?C.增加?D.不确定

答案:A

解析:transform保持原索引,行数不变。

3.某APP推送实验采用双重差分法评估,实验组与对照组在基期与实验期的留存差异分别为–1.2%与+2.8%,则DID估计值为

A.1.6%?B.4.0%?C.–4.0%?D.2.0%

答案:B

解析:2.8%–(–1.2%)=4.0%。

4.在Snowflake云数仓中,以下哪种文件格式查询性能最佳且支持列级加密

A.CSV?B.JSON?C.Parquet?D.XML

答案:C

解析:Parquet列式存储+内置加密。

5.使用XGBoost2.1时,若设置reg_lambda=1.5,其作用是

A.控制树深度?B.L1正则?C.L2正则?D.学习率

答案:C

解析:reg_lambda对应L2惩罚项。

6.某时序模型残差通过Ljung-Box检验得到p=0.003,则

A.残差独立?B.残差非白噪声?C.模型欠拟合?D.需降采样

答案:B

解析:p0.05拒绝原假设,残差存在自相关。

7.Tableau2026.1新增“动态参数”功能,下列场景最适合使用

A.固定报告日期?B.用户实时切换统计口径?C.静态PDF导出?D.数据提取刷新

答案:B

解析:动态参数允许前端交互实时改变计算逻辑。

8.在PySpark3.5中,对超大表a(100TB)与小表b(2GB)做等值join,最佳策略是

A.broadcast(a)?B.broadcast(b)?C.sortmerge?D.shufflehash

答案:B

解析:小表广播避免shuffle。

9.某模型AUC=0.81,PR-AUC=0.42,样本正负比例1:9,则

A.模型很差?B.PR-AUC更能反映性能?C.AUC更能反映性能?D.两者相等

答案:B

解析:极度不平衡时PR-AUC更敏感。

10.使用dbt-core1.8建立模型时,以下哪项不是snapshot的核心字段

A.dbt_valid_from?B.dbt_valid_to?C.dbt_updated_at?D.dbt_created_by

答案:D

解析:snapshot自动加前三个字段。

11.在SQL中,窗口函数ROWSBETWEEN1PRECEDINGANDCURRENTROW对首行返回

A.NULL?B.首行值?C.第二行值?D.报错

答案:B

解析:首行无前一行,边界仅含当前行。

12.某电商采用UpliftModel,若预测τi=0.05,则

A.该用户一定转化?B.该用户营销敏感度高?C.该用户营销敏感度低?D.无法判断

答案:B

解析:τi0表示营销正向激励。

13.在Python中,np.random.default_rng(42).choice(5,size=10,replace=False)会

A.报错?B.返回10个不重复0–4整数?C.返回重复整数?D.返回浮点

答案:A

解析:sizepopulation且replace=False抛ValueError。

14.使用PowerBI2026年6月版,DirectLake模式连接Fabric湖屋,其本质是

A.导入模式?B.DirectQuery?C.混合模式?D.实时视图

答案:B

解析:DirectLake=DirectQueryonLake。

15.某A/B测试样本量计算,期望检出效应0.5%,显著性0.05,power0.8,基线转化率2%,则每组所需样本约为

A.42万?B.84万?C.168万?D.21万

答案:B

解析:双尾Z检验,n≈2×(Zα/2+Zβ)2p(1–p)/Δ2≈840000。

二、多项选择题(每题3分,共30分,多选少选均不得分)

16.下列属于特征缩放优点的是

A.加速梯度下降收敛?B.提高模型可解释性?C.降低L1稀疏解偏差?D.减少数值溢出

答案:A、D

解析:B可解释性未必提升;CL1稀

文档评论(0)

1亿VIP精品文档

相关文档