- 0
- 0
- 约8.53千字
- 约 12页
- 2026-02-08 发布于江苏
- 举报
高级数据分析师考试试卷(总分100分)
一、单项选择题(共10题,每题1分,共10分)
数据治理的核心目标是()
A.提升数据存储效率
B.确保数据的准确性、完整性和一致性
C.优化数据分析速度
D.增加数据存储容量
答案:B
解析:数据治理的核心是通过制度、流程和技术手段保障数据资产的质量,确保数据在全生命周期内可用、可信。A(存储效率)和C(分析速度)属于数据管理的次级目标,D(存储容量)是存储技术的目标,均非核心。
在机器学习模型中,以下哪项指标最适合评估类别不平衡场景下的分类性能?()
A.准确率(Accuracy)
B.F1分数(F1-Score)
C.均方误差(MSE)
D.R平方(R2)
答案:B
解析:类别不平衡时,准确率会因多数类主导而失真,F1分数综合了精确率和召回率,更适合评估此类场景。C和D是回归任务的指标,与分类无关。
AB测试中,若实验组与对照组的样本分配比例为7:3,可能导致的主要问题是()
A.统计检验效力降低
B.实验周期延长
C.数据采集成本增加
D.业务影响范围扩大
答案:A
解析:样本分配不均衡(如7:3)会导致两组样本量差异过大,降低统计检验的效力(Power),可能无法检测到真实的效果差异。B、C、D与分配比例无直接因果关系。
时间序列分析中,“白噪声”序列的核心特征是()
A.存在长期趋势
B.自相关系数显著非零
C.均值为0且方差恒定,无自相关性
D.包含季节性波动
答案:C
解析:白噪声是随机序列的理想状态,其均值和方差恒定,且任意滞后阶数的自相关系数均为0(无自相关性)。A、D是趋势或季节成分的特征,B与白噪声定义矛盾。
特征工程中,“分箱(Binning)”的主要目的是()
A.减少特征维度
B.消除特征间多重共线性
C.将连续变量离散化以捕捉非线性关系
D.提高模型训练速度
答案:C
解析:分箱通过将连续变量划分为区间,将线性关系转化为分段关系,帮助模型捕捉非线性模式。A是降维(如PCA)的目的,B是VIF检验或正则化的目标,D是特征选择的间接效果。
数据仓库(DataWarehouse)的典型架构中,ODS层(操作数据存储层)的主要功能是()
A.存储高度聚合的分析型数据
B.为前端应用提供实时数据服务
C.保留原始业务系统的明细数据,仅做简单清洗
D.存储经过主题域整合的汇总数据
答案:C
解析:ODS层是数据仓库的最底层,主要用于暂存原始业务数据(如ERP、CRM的原始表),仅进行字段映射、去重等简单清洗,不做复杂转换。A是DWS(汇总层)的功能,B是数据湖或实时数据库的功能,D是DWD(明细层)的目标。
基于统计方法的异常检测(如Z-Score),其假设前提是()
A.数据服从正态分布
B.数据存在明确的聚类结构
C.异常点占比超过10%
D.特征间存在强线性关系
答案:A
解析:Z-Score通过计算数据点与均值的标准差距离检测异常,其有效性依赖数据服从正态分布(99.7%的数据在μ±3σ内)。B是聚类方法(如DBSCAN)的假设,C不符合异常点“少数”的定义,D是线性回归的假设。
以下哪项不属于数据质量评估的核心维度?()
A.完整性(Completeness)
B.一致性(Consistency)
C.可解释性(Interpretability)
D.准确性(Accuracy)
答案:C
解析:数据质量的核心维度包括完整性(字段无缺失)、一致性(跨系统定义统一)、准确性(与真实值匹配)、及时性(更新频率)等。可解释性是模型的特性,与数据质量无关。
因果推断中,“后门准则(BackdoorCriterion)”的作用是()
A.识别需要控制的混淆变量
B.评估因果效应的大小
C.验证工具变量的外生性
D.检测样本选择偏差
答案:A
解析:后门准则用于确定需要调整(控制)的变量集合,以阻断原因变量与结果变量之间的“后门路径”(即混淆变量带来的伪相关)。B是因果效应估计(如ATE)的任务,C是工具变量法的步骤,D是敏感性分析的内容。
商业智能(BI)工具中,“钻取(Drill-Down)”功能的主要用途是()
A.将汇总数据拆解为更细粒度的明细数据
B.对数据进行跨维度的对比分析
C.自动生成预测性分析报告
D.可视化展示数据的分布特征
答案:A
解析:钻取允许用户从高层级汇总数据(如“全国销售额”)向下查看更细粒度的数据(如“省份-城市-门店”),支持深度探索。B是切片(Slice)或交叉分析的功能,C是预测分析模块的功能,D是直方图或箱线图的作用。
二、多项选择题(共10题,每题2分,共20分。每题至少2个正确选项)
数据清洗的常见方法包括()
A.缺失
您可能关注的文档
- 2026年ESG分析师认证(CESGA)考试题库(附答案和详细解析)(0112).docx
- 2026年企业合规师考试题库(附答案和详细解析)(0121).docx
- 2026年国际会展管理师考试题库(附答案和详细解析)(0106).docx
- 2026年国际财资管理师(CTP)考试题库(附答案和详细解析)(0112).docx
- 2026年康养管理师考试题库(附答案和详细解析)(0120).docx
- 2026年拍卖师资格证考试题库(附答案和详细解析)(0120).docx
- 2026年注册信息安全经理(CISM)考试题库(附答案和详细解析)(0118).docx
- 2026年注册证券分析师(RSA)考试题库(附答案和详细解析)(0122).docx
- 2026年注册金融工程师(CFE)考试题库(附答案和详细解析)(0122).docx
- 2026年艺术品鉴定评估师考试题库(附答案和详细解析)(0127).docx
最近下载
- DB5101T 18-2018 成都市企业安全生产风险分级管控工作规范 .docx VIP
- 个人房屋买卖合同范本免费下载(25篇).docx VIP
- 2026北京经济技术开发区卫生健康领域事业单位招聘28人备考题库及答案详解(夺冠系列).docx VIP
- (正式版)DB15∕T 2979-2023 《阿尔巴斯型绒山羊饲养管理技术规程》.docx VIP
- JBT 13675-2019 筒式磨机 铸造衬板 技术条件.docx VIP
- 2023年西藏自治区成考(专升本)大学语文考试真题含解析.doc VIP
- 【专家PPT】以电网数字孪生为基座促进AI4EE相关研究.docx
- 【专家观点】基于AI小模型的配电网单相接地保护技术与应用.docx
- 人工智能背景下大电网安全稳定的探索与思考.docx
- 第11讲 相关定理在解三角形中的综合应用(高阶拓展、竞赛适用)(教师版)-2025版高中数学一轮复习考点帮.pdf VIP
原创力文档

文档评论(0)