- 1
- 0
- 约8.02千字
- 约 23页
- 2026-05-26 发布于四川
- 举报
2026年大数据分析师核心知识点考试题及答案
一、单项选择题(每题2分,共30分)
1.以下哪种数据存储方式适合存储海量的非结构化数据?
A.关系型数据库
B.数据仓库
C.分布式文件系统
D.内存数据库
答案:C。关系型数据库主要用于存储结构化数据,有严格的表结构和数据类型约束,A选项不符合。数据仓库是为了支持决策分析而集成的结构化数据集合,B选项不合适。内存数据库将数据存储在内存中,主要用于对性能要求极高的场景,并非针对海量非结构化数据,D选项错误。分布式文件系统如HDFS可以存储海量的非结构化数据,具有高扩展性和容错性,所以选C。
2.在Python中,使用哪个库可以进行数据可视化?
A.NumPy
B.Pandas
C.Matplotlib
D.Scikitlearn
答案:C。NumPy主要用于数值计算,提供了高效的多维数组对象和各种数学函数,A选项错误。Pandas用于数据处理和分析,提供了数据结构如DataFrame等,B选项错误。Scikitlearn是机器学习库,用于各种机器学习算法的实现,D选项错误。Matplotlib是Python中常用的绘图库,可以创建各种类型的可视化图表,所以选C。
3.以下哪种算法属于无监督学习算法?
A.决策树
B.支持向量机
C.聚类算法
D.逻辑回归
答案
原创力文档

文档评论(0)