- 1
- 0
- 约2.46万字
- 约 39页
- 2026-03-09 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、以下哪个工具是基于Hadoop的开源数据仓库工具,用于结构化数据的查询和分析?
A.HBase
B.Hive
C.Pig
D.Flume
【答案】:B
解析:本题考察大数据生态系统工具的功能。HBase是分布式列存储数据库,用于海量结构化数据的随机读写;Hive是基于Hadoop的开源数据仓库工具,使用类SQL的HQL语言对结构化数据进行查询和分析;Pig是数据流语言和执行框架,用于复杂数据转换;Flume是高可用的日志采集系统。因此正确答案为B。
2、在MapReduce编程模型中,哪个阶段负责对Map阶段输出的中间结果进行聚合,生成最终计算结果?
A.Map阶段
B.Reduce阶段
C.Shuffle阶段
D.Split阶段
【答案】:B
解析:本题考察MapReduce编程模型知识点。MapReduce采用“分而治之”思想,分为Map、Shuffle、Reduce三个主要阶段。Map阶段(A)负责将输入数据拆分为键值对,进行初步映射处理;Shuffle阶段(C)负责将Map输出的中间结果按Key分发到对应的Reduce节点;Reduce阶段(B)接收Shuffle后的中间结果,对相同Key的Value进行聚合计算,生成最终结果。Split阶段(D)是数据分片,属于底层准备工作。因此答案为B。
3、大数据的核心特征通常包括“4V”,以下哪一项不属于大数据的“4V”特征?
A.Volume(容量)
B.Velocity(速度)
C.Variety(多样性)
D.Veracity(真实性)
【答案】:D
解析:本题考察大数据的4V特征知识点。大数据的“4V”特征是指Volume(数据规模)、Velocity(数据产生与处理速度)、Variety(数据类型多样性)、Value(价值密度低),而Veracity(真实性)属于数据质量维度,并非“4V”核心特征,因此错误选项D描述错误。
4、Hadoop分布式文件系统(HDFS)的核心作用是?
A.提供分布式计算框架
B.实现海量数据的分布式存储
C.执行数据挖掘算法
D.进行数据可视化展示
【答案】:B
解析:本题考察Hadoop生态系统组件。HDFS是Hadoop的分布式存储系统,主要负责将海量数据分散存储在多台服务器上;A选项是MapReduce/YARN的功能;C选项数据挖掘工具如Mahout不属于HDFS;D选项数据可视化工具如Hue属于辅助组件,非HDFS核心功能。因此正确答案为B。
5、大数据处理中,构建分布式计算集群最常用的云计算服务模式是?
A.IaaS(基础设施即服务)
B.PaaS(平台即服务)
C.SaaS(软件即服务)
D.混合云(混合部署模式)
【答案】:A
解析:本题考察大数据与云计算服务模式的关系知识点。IaaS(A选项)提供服务器、存储、网络等基础设施资源,适合部署Hadoop等分布式计算集群;PaaS(B选项)提供开发运行平台,适合快速开发应用但灵活性不足;SaaS(C选项)是直接提供软件应用,无法满足大数据底层硬件需求;混合云(D选项)是云服务部署模式,非服务类型。因此正确答案为A。
6、在Hadoop生态系统中,负责分布式存储的核心组件是?
A.HDFS
B.MapReduce
C.YARN
D.Hive
【答案】:A
解析:本题考察Hadoop生态系统核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,负责大数据的分布式存储;MapReduce是分布式计算框架,YARN是资源管理器,Hive是基于Hadoop的数据仓库工具。因此负责分布式存储的是HDFS,正确答案为A。
7、在数据仓库设计中,以下哪种模型是由一个事实表和多个直接关联的维度表组成,且维度表之间通常无冗余?
A.星型模型(StarSchema)
B.雪花模型(SnowflakeSchema)
C.星座模型(GalaxySchema)
D.层次模型(HierarchicalModel)
【答案】:A
解析:本题考察数据仓库模型知识点。星型模型的结构为:一个事实表(存储业务指标)和多个维度表(存储维度属性),维度表直接关联事实表,无冗余;雪花模型维度表会进一步分解为子维度表,存在冗余;星座模型包含多个事实表共享维度表;层次模型是传统数据库的树形结构,与数据仓库模型无关。因此正确答案为星型模型。
8、大数据的5V特征中,不包括以下哪一项?
A.Volume
B.Velocity
C.Viscosity
D.Variety
【答案】:C
解析:本题考察大
您可能关注的文档
- 2026年国开电大当代中国政治制度形考题库100道带答案(考试直接用).docx
- 2026年国开电大导游业务形考题库100道附答案【模拟题】.docx
- 2026年国开电大导游业务形考题库100道含完整答案【夺冠系列】.docx
- 2026年国开电大大数据技术概论形考题库100道及完整答案【精选题】.docx
- 2026年国开电大创新思维训练与方法形考题库100道(模拟题).docx
- 2026年国开电大创业机会与商业模式形考题库100道(夺分金卷).docx
- 2026年国开电大创业教育(创业教育专)形考题库100道及答案【全优】.docx
- 国企财务管理岗测试题及答案.docx
- 管理学原理中级自考试题及答案.docx
- 管理学招聘考试题及答案.docx
最近下载
- 《建筑工程资料管理》中职课件-01项目一 建筑工程资料管理.pptx VIP
- 2025年高职单独招生考试英语试卷(答案) .pdf VIP
- 办公空间设计 开敞式办公区设计 办公空间设计--开敞式办公区设计.ppt VIP
- 儿童行为观察课程教学大纲.docx VIP
- 2026年单位开展树立和践行正确政绩观学习教育工作实施方案附重点任务分解表.docx VIP
- 锻炼身体-强身健体主题班会.pptx VIP
- 三菱电梯LEHY-III凌云3图纸-三菱公司内部2016原版.pdf
- 高中英语2026届高考新课标新增词汇解析(词性+汉语解释+例句)(共191个).doc
- 丁玲文学中的医院叙事赏析.pptx VIP
- 管理会计教案.pdf VIP
原创力文档

文档评论(0)