2026年大数据知识试题及答案.docxVIP

  • 2
  • 0
  • 约5.3千字
  • 约 15页
  • 2026-04-28 发布于四川
  • 举报

2026年大数据知识试题及答案

一、单项选择题(每题2分,共20分)

1.以下哪项不属于非结构化数据?

A.社交媒体评论

B.传感器实时数据流

C.关系型数据库表记录

D.监控视频文件

答案:C(解析:关系型数据库表记录是结构化数据,具有预定义的模式和行列结构;其他选项为非结构化或半结构化数据。)

2.关于Hadoop生态中HBase的描述,正确的是?

A.基于行存储的分布式数据库

B.适合实时随机读写场景

C.仅支持SQL查询

D.数据模型为键值对,无列族概念

答案:B(解析:HBase是基于列族存储的分布式NoSQL数据库,支持实时随机读写;数据模型包含行键、列族、时间戳;查询方式包括API和PhoenixSQL。)

3.以下哪项是SparkRDD的特性?

A.不可变、可分区、支持内存计算

B.支持事务ACID特性

C.默认存储在磁盘中

D.仅支持窄依赖操作

答案:A(解析:RDD是弹性分布式数据集,不可变且可分区,支持内存计算以提升性能;SparkSQL的DataFrame/Dataset支持部分ACID;RDD默认根据持久化策略存储;RDD支持窄依赖(如map)和宽依赖(如shuffle)操作。)

4.数据湖(DataLake)与数据仓库(DataWarehouse)的核心区别是?

A.数据湖存储结构化数据,数据仓库存储非结构化数据

B.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档