2026年大数据学习基础练习.docxVIP

  • 0
  • 0
  • 约1.99千字
  • 约 5页
  • 2026-03-12 发布于河北
  • 举报

2026年大数据学习基础练习

考试时间:______分钟总分:______分姓名:______

1.选择题(每题2分,共40分)

(1)大数据通常被定义为具有以下哪个特点的数据集?

A.小规模

B.高速度

C.多样性

D.低价值

E.B和C

(2)以下哪个不是Hadoop生态系统中的组件?

A.HDFS

B.YARN

C.MapReduce

D.HBase

E.MySQL

(3)在Hadoop中,用于处理大规模数据集的分布式计算框架是:

A.HDFS

B.YARN

C.MapReduce

D.Hive

E.HBase

(4)以下哪个不是大数据处理过程中的步骤?

A.数据采集

B.数据清洗

C.数据存储

D.数据分析

E.数据备份

(5)以下哪个不是数据挖掘的常见任务?

A.聚类分析

B.关联规则挖掘

C.分类

D.数据可视化

E.数据压缩

2.填空题(每题2分,共20分)

(1)大数据的4V特点包括:________、________、________、________。

(2)Hadoop生态系统中的核心组件包括:________、________、________。

(3)在Hadoop中,________用于存储大规模数据,________用于处理大规模数据。

(4)数据清洗的目的是________。

(5

文档评论(0)

1亿VIP精品文档

相关文档