2026年大数据应用与分析专业技能测试题.docxVIP

  • 1
  • 0
  • 约6.56千字
  • 约 21页
  • 2026-05-05 发布于福建
  • 举报

2026年大数据应用与分析专业技能测试题.docx

第PAGE页共NUMPAGES页

2026年大数据应用与分析专业技能测试题

一、单选题(每题2分,共20题)

1.在大数据处理中,Hadoop生态系统中的哪个组件主要负责分布式存储和管理海量数据?

A.MapReduce

B.Hive

C.HDFS

D.YARN

答案:C

2.以下哪种算法不属于聚类算法?

A.K-Means

B.Apriori

C.DBSCAN

D.GaussianMixtureModel

答案:B

3.在数据预处理中,处理缺失值最常用的方法是?

A.删除缺失值

B.均值/中位数/众数填充

C.线性回归填充

D.以上都是

答案:D

4.下列哪种数据库更适合处理实时大数据?

A.关系型数据库(MySQL)

B.NoSQL数据库(MongoDB)

C.列式数据库(HBase)

D.图数据库(Neo4j)

答案:C

5.在机器学习模型评估中,AUC值越高表示模型性能?

A.越差

B.越好

C.不确定

D.与模型无关

答案:B

6.以下哪个不是大数据的4V特征?

A.Volume(海量)

B.Velocity(高速)

C.Variety(多样性)

D.Veracity(真实性)

答案:D

7.在Spark中,以下哪个操作属于RDD的转换操作?

A.`filter()`

B.`reduce(

文档评论(0)

1亿VIP精品文档

相关文档