- 3
- 0
- 约4.32千字
- 约 9页
- 2026-06-14 发布于北京
- 举报
2026年关于大数据的测试题及答案
一、单项选择题(总共10题,每题2分)
1.以下哪种数据存储方式更适合大数据的存储与管理?
A.传统关系型数据库
B.分布式文件系统
C.本地硬盘存储
D.移动硬盘存储
2.大数据的5V特性中,“Velocity”指的是?
A.数据量
B.数据多样性
C.数据速度
D.数据真实性
3.以下哪个工具主要用于大数据的批处理?
A.SparkStreaming
B.Flink
C.HadoopMapReduce
D.Kafka
4.数据清洗不包括以下哪个操作?
A.去除重复数据
B.处理缺失值
C.数据加密
D.纠正错误数据
5.以下哪种算法属于聚类算法?
A.K-Means
B.决策树
C.线性回归
D.朴素贝叶斯
6.大数据平台Hadoop中,HDFS主要负责?
A.数据存储
B.数据计算
C.任务调度
D.数据传输
7.以下哪个是大数据实时处理框架?
A.Hive
B.Storm
C.Pig
D.Sqoop
8.以下哪种数据采集方式不属于被动采集?
A.传感器数据采集
B.网络爬虫
C.日志文件采集
D.用户主动填写表单
9.以下关于数据仓库的说法,错误的是?
A.数据仓库是面向主题的
B.数据仓库的数据是动态的,随时更新
C.数据仓库
原创力文档

文档评论(0)