- 2
- 0
- 约2.46万字
- 约 39页
- 2026-03-09 发布于河南
- 举报
2026年国开电大大数据技术概论形考题库100道
第一部分单选题(100题)
1、在大数据预处理阶段,处理缺失值时,对于缺失比例较低且数据分布相对集中的字段,最常用的方法是?
A.直接删除该字段
B.使用均值/中位数填充
C.使用KNN算法填充
D.忽略缺失值
【答案】:B
解析:本题考察数据预处理中缺失值处理方法。A选项直接删除会丢失信息,仅适用于缺失比例极高的字段;B选项均值/中位数填充是课程基础知识点,适用于缺失比例低且数据分布集中的情况;C选项KNN算法属于高级机器学习方法,非基础课程重点;D选项“忽略”会导致数据不完整,影响分析结果。因此正确答案为B。
2、以下哪项属于大数据中的典型非结构化数据?
A.文本数据
B.图像数据
C.视频数据
D.以上都是
【答案】:D
解析:本题考察大数据数据类型分类。非结构化数据是格式不固定、难以用二维表结构表示的数据,典型例子包括文本(如新闻、邮件)、图像(如照片、卫星图)、视频(如监控录像、影视片段)等。因此A、B、C均属于非结构化数据,正确答案为D。
3、大数据的哪个特征描述了数据产生和处理的速度特性?
A.Volume(容量)
B.Velocity(速度)
C.Variety(多样性)
D.Veracity(真实性)
【答案】:B
解析:本题考察大数据5V特征的概念。Velocity(速度)特征强调数据产生、传输和处理的速度要求,是实时或近实时处理的关键;A选项Volume指数据规模(容量),C选项Variety指数据类型多样(结构化、半结构化、非结构化),D选项Veracity指数据的真实性和准确性。因此正确答案为B。
4、下列哪项是大数据技术相比传统数据处理技术的显著差异?
A.处理数据量较小(通常在GB级及以下)
B.处理速度较慢(以小时级甚至天级为单位)
C.基于分布式计算框架实现并行处理
D.仅适用于结构化数据(如关系型数据库表)
【答案】:C
解析:本题考察大数据与传统数据处理的区别知识点。正确答案为C,大数据技术通过分布式计算框架(如Hadoop/Spark)实现并行处理,可高效处理PB级甚至EB级海量数据;传统数据处理多基于单机或小规模集群,处理速度慢于大数据技术;大数据支持结构化、半结构化、非结构化等多种数据类型,且处理数据量远大于传统技术(通常以TB/PB为单位)。
5、以下哪项是数据挖掘的主要目标?
A.实现数据的高效存储
B.从数据中发现隐含的模式和规律
C.对数据进行可视化展示
D.完成数据的备份与恢复
【答案】:B
解析:本题考察数据挖掘的概念。数据挖掘是从大量数据中提取隐含、未知、有价值的信息(如关联规则、分类模型、聚类结构等),其核心目标是发现数据中的模式和规律。而数据存储、可视化、备份均不属于数据挖掘的范畴,因此正确答案为B。
6、Hadoop生态系统中,负责分布式资源管理与调度的核心组件是?
A.HDFS(分布式文件系统)
B.MapReduce(分布式计算框架)
C.YARN(资源管理器)
D.Hive(数据仓库工具)
【答案】:C
解析:本题考察Hadoop生态系统核心组件的功能。选项A的HDFS负责分布式存储海量数据;选项B的MapReduce是分布式计算框架,实现并行计算;选项C的YARN是资源管理器,负责集群资源的分配与调度;选项D的Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。因此正确答案为C。
7、下列哪项不属于大数据预处理的基本步骤?
A.数据清洗
B.数据挖掘
C.数据集成
D.数据转换
【答案】:B
解析:本题考察大数据预处理流程知识点。大数据预处理的基本步骤包括数据清洗(处理噪声、缺失值)、数据集成(合并多源数据)、数据转换(格式转换、归一化)、数据规约(减少数据量)。数据挖掘是在预处理之后的数据分析阶段,不属于预处理步骤,因此正确答案为B。
8、以下哪种技术适用于实时性要求高的场景(如实时监控、实时交易分析)?
A.批处理(如Hadoop离线计算)
B.流处理(如SparkStreaming/Flink)
C.时序数据库(存储时间序列数据)
D.数据挖掘(提取潜在模式)
【答案】:B
解析:本题考察大数据处理技术知识点。批处理(如Hadoop)适合处理历史/海量离线数据;流处理(如SparkStreaming、Flink)针对实时/高速数据流,适用于实时监控、高频交易分析等低延迟场景;时序数据库(如InfluxDB)是存储时间序列数据的工具,非处理技术;数据挖掘是从数据中提取模式的方法,非处理技术。因此正确答案为B。
9、以下哪项是Spark作为大数据处理框架相比MapReduce的显著优势?
A.仅支持非结构化
您可能关注的文档
- 2026年国开电大道路工程技术形考题库100道附参考答案(夺分金卷).docx
- 2026年国开电大当代中国政治制度形考题库100道附参考答案(满分必刷).docx
- 2026年国开电大当代中国政治制度形考题库100道含完整答案【名师系列】.docx
- 2026年国开电大导游业务形考题库100道附参考答案【黄金题型】.docx
- 2026年国开电大导游业务形考题库100道及完整答案【典优】.docx
- 2026年国开电大大数据技术概论形考题库100道附完整答案(有一套).docx
- 2026年国开电大大数据技术形考题库100道附答案(培优a卷).docx
- 2026年国开电大大数据技术形考题库100道含答案【巩固】.docx
- 2026年国开电大大作业形考题库100道及答案【易错题】.docx
- 2026年国开电大传染病护理学形考题库100道附完整答案(名师系列).docx
最近下载
- 学生退学家长知情同意书.docx VIP
- 计算机应用基础教程(Windows10+Office2016)PPT全套完整教学课件.pptx VIP
- 2024年江苏农牧科技职业学院高职单招职业技能测验历年参考题库(频考版)含答案解析.docx
- Unit 2 课时2 Section A (2a-2e) 教学设计-八年级英语上册.docx VIP
- 慢阻肺病标准化筛查问卷、Borg CR10 评分表.docx VIP
- 招标代理服务方案.docx VIP
- AD832I机台操作指引.pdf VIP
- 2019版《普速铁路线路修理规则》(可编辑修改word版).pdf VIP
- KK_Mixly_V3四轴飞行器教程——算法篇.docx VIP
- 河南大学研究生学位论文基本要求与书写格式的.docx VIP
原创力文档

文档评论(0)