2026年云南上市大数据企业入职笔试题及答案解析.docVIP

  • 0
  • 0
  • 约4.54千字
  • 约 12页
  • 2026-06-02 发布于北京
  • 举报

2026年云南上市大数据企业入职笔试题及答案解析.doc

2026年云南上市大数据企业入职笔试题及答案解析

一、单项选择题(共10题,每题2分)

1.在Hadoop生态系统中,主要负责分布式存储的组件是:

A.MapReduce

B.HDFS

C.YARN

D.Hive

2.关于数据仓库特点的描述,错误的是:

A.面向事务处理

B.集成性

C.历史性

D.相对稳定

3.以下哪种算法常用于无监督学习的聚类分析?

A.决策树

B.K-Means

C.支持向量机

D.逻辑回归

4.下列不属于NoSQL数据库类型的是:

A.键值存储

B.文档数据库

C.图数据库

D.关系数据库

5.在数据预处理中,用于处理缺失值的方法不包括:

A.删除含有缺失值的记录

B.使用均值填充

C.使用众数填充

D.增加无关特征

6.Spark的核心抽象是:

A.RDD(弹性分布式数据集)

B.DataFrame

C.Dataset

D.DStream

7.以下关于实时流处理框

文档评论(0)

1亿VIP精品文档

相关文档