- 0
- 0
- 约9.93千字
- 约 22页
- 2026-05-11 发布于四川
- 举报
2026年继续教育公需科目大数据技术及应用题库及答案
一、单选题
1.大数据时代的“大数据”核心特征通常被概括为4V,其中不包括以下哪一项?
A.Volume(大量)
B.Velocity(高速)
C.Value(低价值密度)
D.Validity(有效性)
答案:D
2.在Hadoop生态系统中,负责分布式存储的核心组件是?
A.MapReduce
B.HDFS
C.YARN
D.ZooKeeper
答案:B
3.下列关于关系型数据库与非关系型数据库(NoSQL)的描述,错误的是?
A.关系型数据库遵循ACID原则
B.NoSQL数据库主要处理非结构化数据
C.NoSQL数据库通常具有水平扩展能力
D.关系型数据库不适合处理海量结构化数据
答案:D
4.Spark与MapReduce相比,最主要的区别在于?
A.Spark不支持磁盘存储
B.Spark基于内存计算,速度更快
C.Spark只能处理流数据
D.MapReduce不支持迭代计算
答案:B
5.数据清洗过程中,处理缺失值的方法不包括?
A.删除记录
B.均值填充
C.重复数据
D.插值法
答案:C
6.在数据挖掘中,用于发现数据中项集之间关联规则的算法是?
A.K-Means
B.Apriori
C.ID3
D.SVM
答案:B
7.下列哪项技
您可能关注的文档
- 管道深挖基坑开挖专项施工方案.docx
- 广告招牌标识标牌工程施工组织设计方案.docx
- 烘干机操作和维护保养规程.docx
- 化工有限公司废水处理工程土方开挖施工方案.docx
- 混凝土振捣方案.docx
- 基层母婴健康服务中心建设与管理指南.docx
- 基层医院脑卒中救治中心建设与管理指南.docx
- 基层职业病监测中心建设与管理指南.docx
- 基坑开挖和支护施工方案.docx
- 急性胆道感染诊疗指南.docx
- 2025届湖南省益阳市安化县高三5月三模生物试题(含答案).pdf
- 16.1《赤壁赋》课件统编版高一语文必修上册.pptx
- 2025届江苏省南京市高三下学期第二次模拟考试生物试题(含答案).pdf
- 2025届江苏省南京市高三下学期第二次模拟考试生物试题(含答案).docx
- 2025届江苏省南通市高三一模生物试卷(含答案).docx
- 2025届江苏省南通市高三一模生物试卷(含答案).pdf
- 2025届江苏省苏北七市高三第三次调研生物试题(含答案).docx
- 2025届江苏省苏北七市高三第三次调研生物试题(含答案).pdf
- 11《种树郭橐驼传》课件统编版高二语文选择性必修下册_5.pptx
- 2025届江苏省苏州昆山市陆家高级中学高三二模生物试卷(含答案).docx
原创力文档

文档评论(0)