- 1
- 0
- 约2.45万字
- 约 39页
- 2026-03-09 发布于山东
- 举报
2026年国开电大大数据技术概论形考题库100道
第一部分单选题(100题)
1、大数据的5V特征中,哪一项是指数据量巨大,是大数据最直观的特征?
A.Volume
B.Velocity
C.Variety
D.Veracity
【答案】:A
解析:本题考察大数据的5V特征知识点。正确答案为A。解析:大数据的5V特征中,Volume(数据量)是指数据规模巨大,通常以PB、EB级衡量,是大数据最直观的特征;B选项Velocity(速度)指数据产生和处理的速度极快(如实时数据流);C选项Variety(多样性)指数据类型多样(结构化、半结构化、非结构化);D选项Veracity(真实性)指数据的准确性和可信度。因此A为正确选项。
2、在大数据处理流程中,对数据进行去重、填补缺失值、处理异常值等操作属于以下哪个环节?
A.数据集成
B.数据清洗
C.数据转换
D.数据规约
【答案】:B
解析:本题考察大数据预处理环节知识点。数据清洗是预处理的核心步骤,主要通过去重、填补缺失值、处理异常值等操作提升数据质量;数据集成是合并多源数据,数据转换是调整数据格式/范围,数据规约是压缩数据规模。因此正确答案为B。
3、大数据的哪个特征是指数据产生和处理的速度快?
A.速度(Velocity)
B.容量(Volume)
C.多样性(Variety)
D.价值(Value)
【答案】:A
解析:本题考察大数据的4V特征知识点。大数据的Velocity特征特指数据产生和处理的速度快(如实时流数据处理场景);Volume指数据量巨大(PB级以上),Variety指数据类型多样(结构化、半结构化、非结构化),Value指从海量数据中挖掘潜在价值。因此正确答案为A。
4、Hadoop生态系统中,哪个组件负责分布式文件存储?
A.MapReduce
B.HDFS
C.YARN
D.Hive
【答案】:B
解析:本题考察Hadoop生态系统组件功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,用于在集群中存储海量数据;A选项MapReduce是分布式计算框架,负责并行任务处理;C选项YARN是资源管理器,负责集群资源调度;D选项Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。因此正确答案为B。
5、Spark作为大数据处理框架,相比MapReduce的主要优势是?
A.基于内存计算,处理速度更快
B.只能处理结构化数据,效率更高
C.仅支持实时流数据处理,延迟更低
D.不需要分布式存储支持,部署更简单
【答案】:A
解析:本题考察Spark与MapReduce的核心差异。Spark采用内存计算模型,减少磁盘IO操作,因此处理速度远快于MapReduce的磁盘迭代计算;B选项错误,Spark支持结构化、半结构化、非结构化等多种数据类型;C选项错误,Spark既支持批处理也支持流处理(如StructuredStreaming);D选项错误,Spark依赖分布式存储(如HDFS)进行数据读写。因此正确答案为A。
6、以下哪个工具是Apache开源的,专为大规模数据处理设计的内存计算框架,支持批处理和流处理?
A.Hadoop
B.Spark
C.Flume
D.Hive
【答案】:B
解析:本题考察大数据处理工具特性。Spark是基于内存计算的快速大数据引擎,支持批处理(如SparkSQL)和流处理(SparkStreaming);A选项Hadoop是早期分布式计算生态,MapReduce基于磁盘且性能较低;C选项Flume是日志采集工具;D选项Hive是基于Hadoop的数据仓库工具,侧重SQL查询。正确答案为B。
7、以下哪种是典型的批处理大数据计算框架?
A.SparkStreaming
B.Storm
C.MapReduce
D.Flink
【答案】:C
解析:本题考察大数据计算框架类型。选项C的MapReduce是Hadoop生态系统中经典的批处理计算模型,适用于离线数据处理;选项A的SparkStreaming是实时流处理框架;选项B的Storm是实时流处理框架;选项D的Flink是兼具流处理和批处理能力的框架,但批处理并非其典型代表。因此正确答案为C。
8、以下哪个应用场景体现了大数据在交通领域的典型应用?
A.电商平台的智能推荐系统
B.城市交通流量实时监控与动态调度
C.医院的电子病历分析
D.金融机构的风险评估模型
【答案】:B
解析:城市交通流量实时监控与调度通过大数据采集实时路况、历史数据,实现动态调度,属于交通领域典型应用;A属于电商推荐算法;C属于医疗大数据;D属于金融风险评估。因此
您可能关注的文档
- 2026年国开电大道路工程技术形考题库100道完整版.docx
- 2026年国开电大道路工程技术形考题库100道及一套答案.docx
- 2026年国开电大当代中国政治制度形考题库100道附参考答案(实用).docx
- 2026年国开电大当代中国政治制度形考题库100道含完整答案【历年真题】.docx
- 2026年国开电大当代世界经济与政治形考题库100道含答案【新】.docx
- 2026年国开电大当代世界经济与政治形考题库100道及参考答案【满分必刷】.docx
- 2026年国开电大导游业务形考题库100道附参考答案【培优】.docx
- 2026年国开电大导游业务形考题库100道及答案【典优】.docx
- 2026年国开电大大数据技术概论形考题库100道含完整答案【网校专用】.docx
- 2026年国开电大大数据技术概论形考题库100道及1套参考答案.docx
最近下载
- 美邦服饰存货管理问题分析.docx VIP
- 私募基金投资意向协议.docx VIP
- 电气工程综合实验.doc VIP
- 树立和践行正确政绩观PPT.pptx VIP
- 统编版小学语文三年级上册第六单元 祖国山河 大单元整体学历案教案 教学设计附作业设计(基于新课标教学评一致性).docx VIP
- 建筑施工与环保.pptx VIP
- QBD-CB-UMD-202106150012 曙光DS600 G30系列磁盘阵列用户手册V1.4.pdf VIP
- 汽车式起重机安全技术规程.doc VIP
- 房屋买卖合同书范本下载(2024版).docx VIP
- 超星尔雅《人工智能与科学之美》满分章节测试答案.docx VIP
原创力文档

文档评论(0)