数据开发考试题及答案.docxVIP

  • 0
  • 0
  • 约3.58千字
  • 约 13页
  • 2026-07-04 发布于河南
  • 举报

数据开发考试题及答案

一、单项选择题(共10题,每题2分,总分20分)

1.在ETL(Extract,Transform,Load)与ELT(Extract,Load,Transform)流程中,两者的核心区别在于转换(Transform)操作发生的阶段不同。通常情况下,ELT流程倾向于在以下哪个环境中进行转换操作?

A.数据源数据库

B.HadoopHDFS

C.NoSQL数据库(如MongoDB)

D.数据仓库底层存储(如Hive)

正确答案:D

2.在SQL窗口函数中,`RANK()`、`DENSE_RANK()`和`ROW_NUMBER()`的主要区别在于对并列数据的处理方式。如果有一组数据排名为1、2、2、4,`RANK()`的结果是?

A.1、2、2、4

B.1、2、3、4

C.1、2、2、3

D.1、2、2、5

正确答案:B

3.在Hadoop生态系统中,NameNode的主要作用是?

A.负责数据的实际存储

B.负责HDFS文件系统的元数据管理

C.负责MapReduce任务的调度

D.负责YARN资源的分配

正确答案:B

4.在Spark编程模型中,RDD(弹性分布式数据集)具有以下哪些特性?(多选,本题选非)

A.不可变

B.分区

C.面向对象

D.弱一致性

正确答案:C

5.数据仓库的分层架构中,ODS层(O

文档评论(0)

1亿VIP精品文档

相关文档