2025年大数据分析师职业技能、数据仓库设计与实现试题及答案.docxVIP

  • 3
  • 0
  • 约5.86千字
  • 约 17页
  • 2025-11-13 发布于未知
  • 举报

2025年大数据分析师职业技能、数据仓库设计与实现试题及答案.docx

2025年大数据分析师职业技能、数据仓库设计与实现试题及答案

一、单项选择题(每题2分,共20分)

1.以下哪项不属于大数据分析师需掌握的核心统计分析方法?

A.卡方检验

B.主成分分析

C.神经网络训练

D.时间序列预测

答案:C(神经网络训练属于机器学习模型开发范畴,统计分析更侧重传统统计方法,如假设检验、降维、时序分析等)

2.数据仓库设计中,用于描述业务过程度量值的表称为?

A.维度表

B.事实表

C.汇总表

D.元数据表

答案:B(事实表存储业务过程的量化结果,包含维度外键和度量值;维度表提供上下文描述)

3.在数据清洗过程中,针对“某电商用户年龄字段出现‘200岁’”的异常值,最合理的处理方式是?

A.直接删除该记录

B.用字段均值替代

C.结合业务规则验证(如用户注册时间推算年龄)

D.标记为缺失值后填充

答案:C(异常值需先结合业务逻辑判断合理性,避免机械处理导致数据失真)

4.实时数据仓库与传统离线数据仓库的核心差异在于?

A.存储介质(磁盘/内存)

B.数据更新频率(秒级/天级)

C.模型设计方法(维度建模/关系建模)

D.数据量规模(GB/TB级)

答案:B(实时数据仓库支持秒级或分钟级数据入仓,传统离线通常以天为周期)

文档评论(0)

1亿VIP精品文档

相关文档