大数据导论(第二版):大数据与数据科学.docxVIP

  • 0
  • 0
  • 约5.69千字
  • 约 12页
  • 2026-04-26 发布于湖南
  • 举报

大数据导论(第二版):大数据与数据科学.docx

大数据导论(第二版):大数据与数据科学

一、单选题(每题1分,共20分)

1.大数据通常指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,其特点是()(1分)

A.小规模、结构化

B.大规模、结构化

C.小规模、非结构化

D.大规模、非结构化

【答案】D

【解析】大数据的核心特征是规模巨大且多为非结构化或半结构化数据。

2.下列哪项不是大数据的“4V”特征?()(1分)

A.Volume(体量)

B.Velocity(速度)

C.Variety(多样性)

D.Value(价值)

【答案】D

【解析】大数据的“4V”特征包括体量(Volume)、速度(Velocity)、多样性(Variety)和真实性(Veracity)。

3.以下哪种技术不属于数据预处理阶段?()(1分)

A.数据清洗

B.数据集成

C.数据变换

D.数据挖掘

【答案】D

【解析】数据挖掘属于数据分析阶段,而非预处理阶段。

4.Hadoop生态系统中的MapReduce主要用于()(1分)

A.数据存储

B.数据处理

C.数据查询

D.数据可视化

【答案】B

【解析】MapReduce是Hadoop的核心计算框架,用于大规模数据集的处理。

5.下列哪种数据库适合处理非结构化数据?()(1分)

A.关系型数据库

B.NoSQL数据库

C.搜索引擎

D.事务数据库

【答案】B

【解析】NoSQL数据

文档评论(0)

1亿VIP精品文档

相关文档