2026年国开电大大数据技术概论形考题库100道【网校专用】.docxVIP

  • 0
  • 0
  • 约2.46万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道【网校专用】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、下列哪项是大数据在医疗领域的典型应用?

A.基于用户消费行为的智能推荐系统

B.利用电子病历和基因数据进行精准医疗诊断

C.实时监控城市交通流量优化信号灯

D.分析社交媒体数据预测自然灾害

【答案】:B

解析:本题考察大数据应用场景知识点。精准医疗通过整合电子病历、基因测序、影像数据等多源大数据,分析个体健康特征,实现个性化诊断与治疗方案,是医疗领域典型应用。A属于电商/广告领域的推荐系统;C属于智能交通领域的流量管理;D属于社交媒体舆情分析(或应急领域的灾害预警),均非医疗领域典型应用。

2、下列哪项不属于大数据预处理的基本步骤?

A.数据清洗

B.数据挖掘

C.数据集成

D.数据转换

【答案】:B

解析:本题考察大数据预处理流程知识点。大数据预处理的基本步骤包括数据清洗(处理噪声、缺失值)、数据集成(合并多源数据)、数据转换(格式转换、归一化)、数据规约(减少数据量)。数据挖掘是在预处理之后的数据分析阶段,不属于预处理步骤,因此正确答案为B。

3、在Hadoop生态系统中,负责分布式计算任务调度和资源管理的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(计算模型)

C.YARN(YetAnotherResourceNegotiator)

D.Hive(数据仓库工具)

【答案】:C

解析:本题考察Hadoop生态系统核心组件功能。YARN(YetAnotherResourceNegotiator)是Hadoop2.x版本引入的资源管理器,负责集群资源(CPU、内存等)的分配与调度,协调MapReduce等任务的执行。A选项HDFS是分布式存储系统;B选项MapReduce是分布式计算框架,负责并行计算任务;D选项Hive是基于Hadoop的数据仓库工具,用于SQL查询,均不符合题意。

4、以下哪个应用场景最能体现大数据的‘高速’(Velocity)特征?

A.传统银行柜台业务处理

B.实时交通流量监控与导航

C.企业历史数据归档

D.纸质文件扫描存储

【答案】:B

解析:大数据Velocity特征强调数据处理的高速性。实时交通流量监控需对实时数据流快速采集、分析并反馈导航,体现‘高速’要求。A选项处理速度慢,C选项离线归档,D选项仅存储,均不涉及实时处理。因此正确答案为B。

5、在大数据处理流程中,将不同来源的数据合并到统一存储中的步骤是?

A.数据清洗

B.数据集成

C.数据转换

D.数据规约

【答案】:B

解析:本题考察大数据预处理步骤知识点。数据预处理是大数据处理的关键环节,各步骤含义如下:数据清洗(去除噪声、补全缺失值)、数据集成(合并多源数据)、数据转换(格式转换、归一化等)、数据规约(降维、压缩数据量)。因此将不同来源数据合并的步骤是数据集成,正确答案为B。

6、下列哪种工具常用于实时或准实时的分布式日志收集与聚合?

A.Flume(日志收集框架)

B.Sqoop(数据导入导出工具)

C.Kafka(分布式消息队列)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察大数据数据采集工具的功能,正确答案为A。Flume是Cloudera开源的分布式日志收集系统,支持多数据源(如日志文件、数据库)的实时聚合与传输,具备高可用和可扩展性;B选项Sqoop主要用于Hadoop与关系型数据库间的数据批量导入导出;C选项Kafka是高吞吐量的分布式消息系统,侧重消息传递而非直接日志聚合;D选项Hive是基于Hadoop的SQL数据仓库工具,与日志收集无关。因此A选项正确。

7、大数据的5V特征中,不包含以下哪一项?

A.Volume

B.Velocity

C.Validity

D.Veracity

【答案】:C

解析:本题考察大数据的5V特征知识点。大数据的5V特征包括Volume(数据规模大)、Velocity(数据产生和处理速度快)、Variety(数据类型多样)、Veracity(数据真实性)和Value(数据价值密度低但整体价值高)。选项C的Validity(有效性)不属于5V特征,因此正确答案为C。

8、以下哪项是大数据在金融领域的典型应用?

A.智能交通信号灯调度

B.信用卡欺诈检测

C.在线教育个性化推荐

D.社交媒体舆情监控

【答案】:B

解析:本题考察大数据应用场景。信用卡欺诈检测利用大数据分析交易行为特征,通过异常模式识别潜在欺诈;A选项属于交通领域应用;C选项属于教育/电商领域;D选项属于舆情分析领域。正确答案为B。

9、以下哪项不属于大数据的核心特征?

A.数据规模大(Volume)

B.处

文档评论(0)

1亿VIP精品文档

相关文档