2024年云南大数据校招笔试模拟卷5套附完整答案.doc

2024年云南大数据校招笔试模拟卷5套附完整答案.doc

2024年云南大数据校招笔试模拟卷5套附完整答案

一、单项选择题,(总共10题,每题2分)。

1.在大数据处理中,以下哪种存储格式最适合用于数据仓库的列式存储?

A.CSV

B.JSON

C.Parquet

D.XML

2.关于Hadoop的HDFS,下列哪项描述是正确的?

A.HDFS适合存储大量小文件

B.HDFS默认的副本数是2

C.HDFS的NameNode负责存储数据块

D.HDFS采用主从架构

3.在MapReduce模型中,Shuffle阶段的主要作用是?

A.数据输入

B.数据排序和分区

C.

文档评论(0)

1亿VIP精品文档

相关文档