大数据分析工程师考试试卷及答案.docVIP

  • 2
  • 0
  • 约2.71千字
  • 约 7页
  • 2026-05-19 发布于山东
  • 举报

大数据分析工程师考试试卷及答案

试题部分

一、填空题(共10题,每题1分)

1.Hadoop生态中负责分布式存储的核心组件是______。

2.Spark的核心数据抽象是______。

3.无监督学习算法K-means的核心目标是最小化______。

4.流处理框架Flink的核心特性是______。

5.HBase是一种______型NoSQL数据库。

6.SparkSQL中加载JSON数据的函数是______。

7.数据仓库的核心设计方法是______。

8.Kafka中存储消息的基本单元是______。

9.机器学习中用于回归任务的经典算法是______。

10.HDFS默认的文件块大小是______MB。

二、单项选择题(共10题,每题2分)

1.以下属于Hadoop核心组件的是?

A.MySQLB.HDFSC.RedisD.Elasticsearch

2.Spark中属于转换操作的是?

A.count()B.collect()C.map()D.first()

3.用于数据仓库查询分析的工具是?

A.HiveB.KafkaC.ZookeeperD.Flume

4.K-means算法的初始聚类中心会影响?

A.聚类结果B.数据规模C.输入类型D.存储成本

5.以下属于NoSQL数据库的是?

A.PostgreSQLB.MongoDBC.OracleD.SQLServer

6.

文档评论(0)

1亿VIP精品文档

相关文档