- 1
- 0
- 约7.09千字
- 约 14页
- 2026-03-06 发布于河南
- 举报
2025年数据分析师继续教育考试试题及答案解析
篇1
考试时间:______分钟总分:______分姓名:______
注意事项:
1.答题前填写好自己的姓名、班级、考号等信息;
2.请将答案正确填写在答题卡上
一、选择题(每题2分,共10题)
1.数据分析中,用于描述数据集中各变量之间关系的统计量是?
A.方差
B.相关系数
C.均值
D.标准差
答案:B
解析:相关系数衡量变量间的线性关系,是描述数据集中变量间关系的常用统
计量。
2.数据清洗阶段,处理异常值的主要方法不包括?
A.删除
B.修正
C.舍入
D.替换
答案:C
解析:舍入属于数值处理,异常值处理通常删除或替换实现。
3.哪种算法属于监督学习?
A.K-means聚类
B.决策树
C.PCA降维
D.随机森林
答案:B
解析:决策树需标注数据训练,属于监督学习;K-means和PCA是无监督,随
机森林是监督学习。
4.数据可视化中,用于展示时间序列数据的图表是?
A.饼图
B.折线图
C.柱状图
D.散点图
答案:B
解析:折线图擅长表现随时间变化趋势,饼图用于比例分布。
5.机器学习模型评估中,交叉验证的主要目的是?
A.提高模型精度
B.避免过拟合
C.减少计算成本
D.增加数据量
答案:B
解析:交叉验证分块训练测试,有效评估模型泛化能力,防止过拟合。
6.数据归一化的主要目的是?
A.增加数据方差
B.统一量纲
C.提高计算效率
D.删除无效数据
答案:B
解析:归一化将不同量纲数据缩放到统一范围(如0-1),便于模型训练。
7.哪种数据库适合处理非结构化数据?
A.MySQL
B.MongoDB
C.Oracle
D.SQLServer
答案:B
解析:MongoDB是文档型数据库,支持JSON等非结构化数据存储。
8.数据特征工程中,特征交叉(FeatureCrossing)的作用是?
A.删除冗余特征
B.增加特征维度
C.降低噪声
D.合并同类数据
答案:B
解析:组合原始特征(如相乘、相加)生成新特征,扩展特征空间。
9.在A/B测试中,控制组(ControlGroup)的目的是?
A.对比实验组效果
B.提供基准参考
C.减少样本量
D.提高用户参与度
答案:B
解析:控制组不进行实验操作,作为基准用于对比实验组变化。
10.数据分析中,用于预测未来趋势的常用模型是?
A.聚类分析
B.时间序列分析
C.决策树
D.聚类分析
答案:B
解析:时间序列模型(如ARIMA、Prophet)专用于预测时序数据趋势。
二、填空题(每空2分,共5空)
1.数据预处理的关键步骤包括数据清洗、____和缺失值处理。
答案:数据转换
解析:数据清洗后需进行标准化、归一化等转换。
2.机器学习模型的评估指标中,分类问题常用____和准确率。
答案:精确率
解析:精确率衡量预测为正样本的准确性,与召回率、F1值相关。
3.数据仓库的三个主要层次是OLAP、____和DWD。
答案:ODS
解析:数据仓库分层为ODS(操作数据存储)、DWD(数据仓库明细层)、DWS
(数据仓库汇总层)。
4.数据可视化中,用于比较多个类别的占比的图表是?
答案:堆叠柱状图
解析:堆叠柱状图颜色区分类别,直观展示占比差异。
5.在SQL查询中,____用于过滤重复记录。
答案:DISTINCT
解析:DISTINCT关键字在SELECT语句中去除重复值。
三、简答题(每题5分,共4题)
1.简述回归分析与分类分析的主要区
原创力文档

文档评论(0)