云南省2024年大数据工程师岗笔试题及逐题答案解析.doc

云南省2024年大数据工程师岗笔试题及逐题答案解析.doc

云南省2024年大数据工程师岗笔试题及逐题答案解析

一、单项选择题(每题2分,共20分)

1.以下哪种文件格式常用于存储大数据,且具有良好的压缩性和分块存储特性?

A.CSV

B.JSON

C.Parquet

D.XML

2.在Hadoop分布式文件系统(HDFS)中,默认的块大小是多少?

A.64MB

B.128MB

C.256MB

D.512MB

3.Spark中,用于创建RDD(弹性分布式数据集)的操作是?

A.transformation

B.action

C.reduce

D.collect

4.以下哪个不是NoSQL数据库的类型?

A.键值对数

文档评论(0)

1亿VIP精品文档

相关文档