- 1
- 0
- 约5.26千字
- 约 7页
- 2026-05-08 发布于河北
- 举报
大数据测试题及详细答案
一、单项选择题(每题5分,共50分)
下列选项中,不属于大数据核心特征的是()
A.海量性(Volume)B.高速性(Velocity)C.单一性(Uniqueness)D.价值性(Value)
Hadoop生态系统中,负责分布式存储的组件是()
A.MapReduceB.HDFSC.YARND.Spark
Spark中,下列哪个操作属于窄依赖()
A.groupByKeyB.reduceByKeyC.mapD.join
数据清洗过程中,处理缺失值的常用方法不包括()
A.删除法B.填充法C.插值法D.加密法
下列哪种文件格式更适合大数据场景下的高效读取和压缩存储()
A.TXTB.CSVC.ParquetD.DOCX
Hive的本质是()
A.分布式数据库B.数据仓库工具C.编程语言D.分布式计算框架
大数据处理流程中,“数据采集”之后的核心步骤是()
A.数据可视化B.数据存储C.数据建模D.
原创力文档

文档评论(0)