2025年大数据技术应用考试试卷及答案.docxVIP

  • 3
  • 0
  • 约7.77千字
  • 约 21页
  • 2025-09-10 发布于四川
  • 举报

2025年大数据技术应用考试试卷及答案.docx

2025年大数据技术应用考试及答案

一、单项选择题(每题2分,共30分)

1.下列哪个不是大数据的特征?()

A.数据量大

B.数据类型单一

C.处理速度快

D.价值密度低

答案:B

解析:大数据具有数据量大(Volume)、数据类型多样(Variety)、处理速度快(Velocity)、价值密度低(Value)等特征,数据类型单一不是大数据的特征。

2.Hadoop中负责资源管理和任务调度的组件是()

A.HDFS

B.MapReduce

C.YARN

D.HBase

答案:C

解析:HDFS是分布式文件系统,用于存储数据;MapReduce是分布式计算框架;YARN负责Hadoop集群的资源管理和任务调度;HBase是分布式列式数据库。

3.以下哪种数据存储格式适合存储大规模的结构化数据,并且支持高效的随机读写?()

A.CSV

B.JSON

C.Parquet

D.XML

答案:C

解析:Parquet是一种列式存储格式,适合存储大规模结构化数据,支持高效的随机读写。CSV和XML是文本格式,JSON是一种轻量级的数据交换格式,它们在大规模数据存储和随机读写方面不如Parquet高效。

4.在Spark中,RDD是()

A.弹性分布式数据集

B.分布式文件系统

C.资源管理器

D.

文档评论(0)

1亿VIP精品文档

相关文档