- 0
- 0
- 约1.99千字
- 约 5页
- 2026-03-12 发布于河北
- 举报
2026年大数据学习基础练习
考试时间:______分钟总分:______分姓名:______
1.选择题(每题2分,共40分)
(1)大数据通常被定义为具有以下哪个特点的数据集?
A.小规模
B.高速度
C.多样性
D.低价值
E.B和C
(2)以下哪个不是Hadoop生态系统中的组件?
A.HDFS
B.YARN
C.MapReduce
D.HBase
E.MySQL
(3)在Hadoop中,用于处理大规模数据集的分布式计算框架是:
A.HDFS
B.YARN
C.MapReduce
D.Hive
E.HBase
(4)以下哪个不是大数据处理过程中的步骤?
A.数据采集
B.数据清洗
C.数据存储
D.数据分析
E.数据备份
(5)以下哪个不是数据挖掘的常见任务?
A.聚类分析
B.关联规则挖掘
C.分类
D.数据可视化
E.数据压缩
2.填空题(每题2分,共20分)
(1)大数据的4V特点包括:________、________、________、________。
(2)Hadoop生态系统中的核心组件包括:________、________、________。
(3)在Hadoop中,________用于存储大规模数据,________用于处理大规模数据。
(4)数据清洗的目的是________。
(5
原创力文档

文档评论(0)