2026年国开电大大数据技术概论形考题库100道含答案(巩固).docxVIP

  • 1
  • 0
  • 约2.51万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道含答案(巩固).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、Hadoop分布式文件系统的英文缩写是?

A.HBase

B.HDFS

C.MapReduce

D.YARN

【答案】:B

解析:HDFS是HadoopDistributedFileSystem的缩写,是Hadoop生态系统中负责存储海量数据的分布式文件系统。A选项HBase是分布式NoSQL数据库;C选项MapReduce是并行计算框架;D选项YARN是资源管理器。因此正确答案为B。

2、以下哪项是数据挖掘的主要目标?

A.直接存储原始数据(数据存储属于数据管理环节,非挖掘目标)

B.发现数据中的模式和规律(数据挖掘通过算法从数据中提取隐含、未知的有价值信息,即模式和规律)

C.对数据进行简单的统计描述(统计描述属于描述性分析,非数据挖掘核心目标)

D.压缩数据文件大小(数据压缩属于数据预处理技术,与数据挖掘无关)

【答案】:B

解析:本题考察数据挖掘的核心定义知识点。数据挖掘是从大量数据中提取隐含的、未知的、有价值的模式或规律的过程,其核心目标是发现数据中的价值信息。选项A是存储环节,选项C是基础统计分析,选项D是数据压缩技术,均不符合数据挖掘目标。因此正确答案为B。

3、以下哪项不属于大数据的5V特征?

A.Volume

B.Velocity

C.Validity

D.Variety

【答案】:C

解析:本题考察大数据的5V特征知识点。大数据的5V特征包括Volume(数据容量)、Velocity(处理速度)、Variety(数据多样性)、Veracity(数据真实性)和Value(数据价值)。选项C的Validity(有效性)并非5V特征之一,因此正确答案为C。

4、大数据的4V特征中,不包括以下哪一项?

A.Volume(数据容量)

B.Velocity(处理速度)

C.Veracity(真实性)

D.Variety(数据多样性)

【答案】:C

解析:本题考察大数据的4V核心特征知识点。大数据标准4V特征为Volume(数据量大)、Velocity(处理速度快)、Variety(数据类型多样)、Value(价值密度低);Veracity(真实性)属于大数据扩展特征,非4V核心内容。因此正确答案为C。

5、大数据技术中,通常所说的‘4V’核心特征不包括以下哪一项?

A.数据量(Volume)

B.数据速度(Velocity)

C.数据多样性(Variety)

D.数据真实性(Veracity)

【答案】:D

解析:本题考察大数据‘4V’特征的基本概念。大数据经典‘4V’特征为:数据量(Volume,指数据规模庞大)、数据速度(Velocity,指数据产生和处理的速度快)、数据多样性(Variety,指数据类型多样,如结构化、半结构化、非结构化)、数据价值(Value,指从海量数据中挖掘潜在价值)。选项D的‘数据真实性(Veracity)’是后期扩展的特征,并非‘4V’核心定义,因此正确答案为D。

6、以下哪项是大数据在电商领域的典型应用?

A.智能交通信号控制

B.电商个性化商品推荐

C.基因序列分析与疾病预测

D.工业机器人故障预警

【答案】:B

解析:本题考察大数据应用场景知识点。电商领域利用用户行为数据(如浏览、购买记录)进行用户画像,实现个性化推荐,属于典型应用。选项A“智能交通”属于交通领域大数据应用;选项C“基因分析”属于医疗/生物信息学;选项D“工业机器人”属于工业物联网应用,均不符合电商场景。

7、大数据的5V特征中,不包括以下哪一项?

A.Variety(多样性)

B.Velocity(速度)

C.Value(价值)

D.Viscosity(粘度)

【答案】:D

解析:本题考察大数据的5V特征知识点。大数据的5V特征标准定义为Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(真实性)、Value(价值),而“Viscosity(粘度)”并非大数据特征范畴,属于干扰项。因此正确答案为D。

8、在大数据处理中,Spark相比MapReduce的显著优势是?

A.仅适用于批处理任务

B.采用磁盘存储中间结果

C.支持内存计算,速度更快

D.不支持实时流处理

【答案】:C

解析:本题考察Spark与MapReduce的技术对比知识点。Spark是内存计算框架,中间结果存储在内存中,大幅减少磁盘I/O,因此处理速度远快于基于磁盘的MapReduce(批处理框架),C选项正确。A选项错误,Spark同时支持批处理和流处理(如SparkStreaming);B选项错误,Spark优先使用内存而非磁盘存储

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档