- 1
- 0
- 约1.82万字
- 约 21页
- 2026-05-06 发布于河北
- 举报
2025年计算机考研大数据真题解析卷
考试时间:______分钟总分:______分姓名:______
一、判断题(请判断下列叙述的正误,正确的划“√”,错误的划“×”)
1.大数据时代的核心特征是“4V”,即Volume(体量)、Velocity(速度)、Variety(多样性)和Veracity(真实性)。
2.HadoopDistributedFileSystem(HDFS)采用主/从(Master/Slave)架构,其中NameNode负责管理文件系统的元数据,而DataNode负责存储实际数据块。
3.MapReduce编程模型中的Map阶段主要负责数据的过滤和排序,Reduce阶段则对Map阶段输出的键值对进行聚合或汇总。
4.YARN(YetAnotherResourceNegotiator)是Hadoop2.x版本引入的资源管理和任务调度框架,它将资源管理和作业调度分离,提高了系统的可扩展性。
5.ApacheSpark是一个快速、通用、可扩展的分布式计算系统,它采用RDD(ResilientDistributedDataset)作为核心数据结构,支持SparkSQL、Streaming、MLlib和GraphX等多种应用。
6.NoSQL数据库由于其灵活的数据模型和horizontallysc
原创力文档

文档评论(0)