大数据开发笔试题全解与答案解析思路.pdfVIP

  • 4
  • 0
  • 约4.45千字
  • 约 9页
  • 2026-03-06 发布于河南
  • 举报

大数据开发笔试题全解与答案解析思路.pdf

大数据开发笔试题全解与答案解析思路

一、单选题(每题2分,共20分)

1.下列哪种技术不是用于数据预处理阶段?()

A.数据清洗B.数据集成C.特征工程D.数据转换

【答案】C

【解析】特征工程属于模型构建阶段,数据清洗、数据集成、数据转换属于数据预

处理阶段。

2.在大数据环境中,下列哪种存储方式最适合海量、多样化数据的存储?()

A.关系型数据库B.列式存储系统C.键值存储系统D.文件系统

【答案】B

【解析】列式存储系统适合海量、多样化数据的存储和分析。

3.在Hadoop生态系统中,下列哪个组件负责数据仓库的查询和优化?()

A.HDFSB.YARNC.HiveD.MapReduce

【答案】C

【解析】Hive负责数据仓库的查询和优化,提供SQL接口。

4.以下哪种算法不属于聚类算法?()

A.K-MeansB.DBSCANC.KNND.SVM

【答案】D

【解析】SVM(支持向量机)属于分类算法,K-Means、DBSCAN、KNN属于聚类算

法。

5.在大数据技术中,下列哪个概念指的是通过分析用户行为数据来预测用户需求?

()

A.数据挖掘B.机器学习C.数据可视化D.推荐系统

【答案】D

【解析】推荐系统通过分析用户行为数据来预测用户需求。

6

文档评论(0)

1亿VIP精品文档

相关文档