2026年国开电大大数据技术概论形考题库100道含答案（巩固）.docxVIP

下载本文档

1
0
约2.51万字
约 39页
2026-03-09 发布于河南
举报

2026年国开电大大数据技术概论形考题库100道含答案（巩固）.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、Hadoop分布式文件系统的英文缩写是？

A.HBase

B.HDFS

C.MapReduce

D.YARN

【答案】：B

解析：HDFS是HadoopDistributedFileSystem的缩写，是Hadoop生态系统中负责存储海量数据的分布式文件系统。A选项HBase是分布式NoSQL数据库；C选项MapReduce是并行计算框架；D选项YARN是资源管理器。因此正确答案为B。

2、以下哪项是数据挖掘的主要目标？

A.直接存储原始数据（数据存储属于数据管理环节，非挖掘目标）

B.发现数据中的模式和规律（数据挖掘通过算法从数据中提取隐含、未知的有价值信息，即模式和规律）

C.对数据进行简单的统计描述（统计描述属于描述性分析，非数据挖掘核心目标）

D.压缩数据文件大小（数据压缩属于数据预处理技术，与数据挖掘无关）

【答案】：B

解析：本题考察数据挖掘的核心定义知识点。数据挖掘是从大量数据中提取隐含的、未知的、有价值的模式或规律的过程，其核心目标是发现数据中的价值信息。选项A是存储环节，选项C是基础统计分析，选项D是数据压缩技术，均不符合数据挖掘目标。因此正确答案为B。

3、以下哪项不属于大数据的5V特征？

A.Volume

B.Velocity

C.Validity

D.Variety

【答案】：C

解析：本题考察大数据的5V特征知识点。大数据的5V特征包括Volume（数据容量）、Velocity（处理速度）、Variety（数据多样性）、Veracity（数据真实性）和Value（数据价值）。选项C的Validity（有效性）并非5V特征之一，因此正确答案为C。

4、大数据的4V特征中，不包括以下哪一项？

A.Volume（数据容量）

B.Velocity（处理速度）

C.Veracity（真实性）

D.Variety（数据多样性）

【答案】：C

解析：本题考察大数据的4V核心特征知识点。大数据标准4V特征为Volume（数据量大）、Velocity（处理速度快）、Variety（数据类型多样）、Value（价值密度低）；Veracity（真实性）属于大数据扩展特征，非4V核心内容。因此正确答案为C。

5、大数据技术中，通常所说的‘4V’核心特征不包括以下哪一项？

A.数据量（Volume）

B.数据速度（Velocity）

C.数据多样性（Variety）

D.数据真实性（Veracity）

【答案】：D

解析：本题考察大数据‘4V’特征的基本概念。大数据经典‘4V’特征为：数据量（Volume，指数据规模庞大）、数据速度（Velocity，指数据产生和处理的速度快）、数据多样性（Variety，指数据类型多样，如结构化、半结构化、非结构化）、数据价值（Value，指从海量数据中挖掘潜在价值）。选项D的‘数据真实性（Veracity）’是后期扩展的特征，并非‘4V’核心定义，因此正确答案为D。

6、以下哪项是大数据在电商领域的典型应用？

A.智能交通信号控制

B.电商个性化商品推荐

C.基因序列分析与疾病预测

D.工业机器人故障预警

【答案】：B

解析：本题考察大数据应用场景知识点。电商领域利用用户行为数据（如浏览、购买记录）进行用户画像，实现个性化推荐，属于典型应用。选项A“智能交通”属于交通领域大数据应用；选项C“基因分析”属于医疗/生物信息学；选项D“工业机器人”属于工业物联网应用，均不符合电商场景。

7、大数据的5V特征中，不包括以下哪一项？

A.Variety（多样性）

B.Velocity（速度）

C.Value（价值）

D.Viscosity（粘度）

【答案】：D

解析：本题考察大数据的5V特征知识点。大数据的5V特征标准定义为Volume（数据量）、Velocity（速度）、Variety（多样性）、Veracity（真实性）、Value（价值），而“Viscosity（粘度）”并非大数据特征范畴，属于干扰项。因此正确答案为D。

8、在大数据处理中，Spark相比MapReduce的显著优势是？

A.仅适用于批处理任务

B.采用磁盘存储中间结果

C.支持内存计算，速度更快

D.不支持实时流处理

【答案】：C

解析：本题考察Spark与MapReduce的技术对比知识点。Spark是内存计算框架，中间结果存储在内存中，大幅减少磁盘I/O，因此处理速度远快于基于磁盘的MapReduce（批处理框架），C选项正确。A选项错误，Spark同时支持批处理和流处理（如SparkStreaming）；B选项错误，Spark优先使用内存而非磁盘存储

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年国开电大大数据技术概论形考题库100道含答案（巩固）.docxVIP