- 1
- 0
- 约4.65千字
- 约 15页
- 2026-05-03 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年大数据从业者入门知识题库
一、单选题(每题2分,共20题)
1.大数据的4V特征不包括以下哪一项?
A.体量巨大(Volume)
B.速度快(Velocity)
C.多样性(Variety)
D.可见性(Visibility)
2.下列哪种工具不属于Hadoop生态系统的一部分?
A.HDFS
B.MapReduce
C.Spark
D.Hive
3.SQL中用于对数据进行排序的函数是?
A.SUM()
B.COUNT()
C.ORDERBY
D.GROUPBY
4.大数据分析中,K-Means聚类算法属于哪种类型?
A.分类算法
B.回归算法
C.聚类算法
D.关联算法
5.下列哪种数据库最适合处理大数据?
A.关系型数据库(如MySQL)
B.NoSQL数据库(如MongoDB)
C.文件系统(如HDFS)
D.数据仓库(如Snowflake)
6.大数据时代,以下哪项技术最能体现实时数据处理能力?
A.批处理
B.流处理
C.事务处理
D.查询优化
7.数据挖掘中的“关联规则”通常用什么算法实现?
A.决策树
B.Apriori
C.K-Means
D.PCA
8.以下哪种技术可以用于数据清洗中的缺失值处理?
A.神经网络
B.插值法
C.
原创力文档

文档评论(0)