2026年大数据分析师考点归纳试题及答案.docxVIP

  • 1
  • 0
  • 约6.84千字
  • 约 21页
  • 2026-05-26 发布于四川
  • 举报

2026年大数据分析师考点归纳试题及答案.docx

2026年大数据分析师考点归纳试题及答案

一、单项选择题(每题2分,共40分)

1.以下哪种数据存储方式最适合存储大规模的结构化数据?

A.关系型数据库

B.非关系型数据库

C.分布式文件系统

D.内存数据库

答案:A。关系型数据库以表格形式存储数据,具有严格的结构和模式,适合处理大规模的结构化数据,能保证数据的一致性和完整性。非关系型数据库更适合处理半结构化和非结构化数据;分布式文件系统主要用于存储大量的非结构化数据;内存数据库适合对数据读写速度要求极高的场景。

2.在数据清洗中,处理缺失值的方法不包括以下哪一项?

A.删除含有缺失值的记录

B.用均值填充缺失值

C.用中位数填充缺失值

D.用众数填充非数值型缺失值

E.直接忽略缺失值

答案:E。直接忽略缺失值可能会导致分析结果的偏差,因为缺失值可能包含重要信息。而删除含有缺失值的记录、用均值、中位数填充数值型缺失值,用众数填充非数值型缺失值都是常见的数据清洗中处理缺失值的方法。

3.以下哪个算法不属于聚类算法?

A.KMeans

B.DBSCAN

C.决策树

D.层次聚类

答案:C。决策树是一种分类和回归算法,用于构建决策模型进行分类或预测。KMeans、DBSCAN和层次聚类都是常见的聚类算法,用于将数据对象划分为不同的簇。

4.大数据分析中,数据可视化的主要目的不包括:

A.发现数据

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档