- 0
- 0
- 约4.54千字
- 约 12页
- 2026-06-02 发布于北京
- 举报
2026年云南上市大数据企业入职笔试题及答案解析
一、单项选择题(共10题,每题2分)
1.在Hadoop生态系统中,主要负责分布式存储的组件是:
A.MapReduce
B.HDFS
C.YARN
D.Hive
2.关于数据仓库特点的描述,错误的是:
A.面向事务处理
B.集成性
C.历史性
D.相对稳定
3.以下哪种算法常用于无监督学习的聚类分析?
A.决策树
B.K-Means
C.支持向量机
D.逻辑回归
4.下列不属于NoSQL数据库类型的是:
A.键值存储
B.文档数据库
C.图数据库
D.关系数据库
5.在数据预处理中,用于处理缺失值的方法不包括:
A.删除含有缺失值的记录
B.使用均值填充
C.使用众数填充
D.增加无关特征
6.Spark的核心抽象是:
A.RDD(弹性分布式数据集)
B.DataFrame
C.Dataset
D.DStream
7.以下关于实时流处理框
您可能关注的文档
最近下载
- (正式版)DB43∕T 845-2013 《靖州干茯苓》.pdf VIP
- 降低腹腔镜术后腹胀发生率(共57页).pptx
- 2026年新疆社区工作者招聘考试历年参考题库含答案详解.docx
- 工程项目的固废处置方案(3篇).docx
- 05X101-2地下通信线缆敷设(标准图集).pdf VIP
- 急性心梗诊疗(2025最新指南)解读PPT课件.pptx VIP
- 急性心梗诊疗(2025+最新指南)解读PPT课件.pptx VIP
- 阿尔茨海默病(老年痴呆)患者的护理查房.pptx VIP
- 2023--2024学年人教版数学七年级下册期末模拟试卷(含答案).pdf VIP
- 建筑工程制图与识图题库练习及答案.docx VIP
原创力文档

文档评论(0)