2026年国开电大大数据技术概论形考题库100道及参考答案(培优).docxVIP

  • 0
  • 0
  • 约2.49万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道及参考答案(培优).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、以下哪项属于大数据中的非结构化数据?

A.关系型数据库表中的用户信息数据

B.Excel表格中按固定格式存储的销售数据

C.社交媒体平台的用户评论文本

D.企业ERP系统中结构化的财务报表数据

【答案】:C

解析:本题考察大数据数据类型知识点。结构化数据具有固定格式和预定义模型,通常存储在关系型数据库中(如A、B、D选项);非结构化数据无固定格式,如文本、图片、音频等。C选项的用户评论文本属于非结构化数据,因此正确答案为C。

2、以下哪项是大数据在医疗健康领域的典型应用?

A.智慧城市管理

B.精准医疗服务

C.智能交通调度

D.工业物联网监控

【答案】:B

解析:本题考察大数据应用场景知识点。精准医疗通过分析患者基因数据、病历数据等海量医疗信息,实现个性化诊断与治疗方案,属于大数据在医疗领域的典型应用。智慧城市管理(城市交通、安防等)、智能交通调度(交通流量分析)、工业物联网监控(设备状态监测)分别属于城市管理、交通、工业领域的应用,因此正确答案为B。

3、大数据分析的最终目标是?

A.实现数据的高效存储

B.完成数据的可视化展示

C.从海量数据中发现有价值的信息

D.对数据进行采集和传输

【答案】:C

解析:本题考察大数据分析的核心目标。大数据分析的本质是从海量、多源数据中挖掘潜在规律、趋势或关联,最终实现价值发现(如用户画像、风险预测);数据存储、可视化、采集传输均是处理流程中的环节,而非最终目标。因此正确答案为C。

4、在Hadoop生态系统中,负责分布式计算任务调度与执行的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.ZooKeeper(分布式协调服务)

【答案】:B

解析:本题考察Hadoop生态系统核心组件知识点。HDFS是分布式存储组件,负责数据存储;MapReduce是分布式计算框架,核心功能是任务调度与执行;YARN是资源管理器,负责集群资源管理;ZooKeeper是分布式协调服务。因此正确答案为B。

5、在大数据处理流程中,以下哪项属于数据清洗的主要任务?

A.数据格式转换

B.识别并处理缺失值

C.数据存储到分布式数据库

D.对数据进行可视化分析

【答案】:B

解析:本题考察大数据数据预处理阶段的“数据清洗”知识点。数据清洗的核心是处理原始数据中的噪声和错误,包括识别并处理缺失值、异常值、重复值等。A选项“数据格式转换”属于数据转换阶段;C选项“存储到分布式数据库”属于数据存储阶段;D选项“可视化分析”属于数据展示与分析阶段,均不属于数据清洗任务。因此正确答案为B。

6、以下哪项不属于大数据在交通领域的典型应用?

A.实时交通流量监控与调度

B.智能推荐商品(电商场景)

C.城市交通拥堵预测与疏导

D.公共交通线路优化

【答案】:B

解析:本题考察大数据应用场景分类。A、C、D均为交通领域应用:实时流量监控用于动态调整信号灯,拥堵预测用于提前疏导,线路优化提升公交效率;B选项“智能推荐商品”是大数据在电商领域的典型应用(基于用户行为分析),与交通领域无关。因此正确答案为B。

7、以下哪项数据挖掘任务的目标是发现数据对象间的共同特征,并将具有相似特征的对象划分为同一组?

A.分类(Classification)

B.聚类(Clustering)

C.回归(Regression)

D.关联规则挖掘(AssociationRuleMining)

【答案】:B

解析:本题考察数据挖掘核心任务。聚类是无监督学习的典型任务,通过算法将数据对象划分为多个组(簇),组内对象相似度高、组间差异大。A选项分类是有监督学习,需已知类别标签,预测新对象类别;C选项回归用于预测连续型数值;D选项关联规则挖掘发现变量间的依赖关系(如“购买A的用户80%也购买B”),均不符合题意。

8、Hadoop生态系统中,MapReduce的核心设计思想是?

A.分而治之

B.快速排序

C.哈希表查找

D.动态规划

【答案】:A

解析:本题考察Hadoop生态系统中MapReduce的核心思想。MapReduce是一种分布式计算框架,其核心思想是将复杂任务分解为多个子任务(Map阶段)并行处理,再将结果汇总(Reduce阶段),即“分而治之”。选项B(快速排序)、C(哈希表查找)、D(动态规划)均不属于MapReduce的核心思想,因此正确答案为A。

9、以下哪类数据不属于大数据的主要数据类型?

A.结构化数据

B.半结构化数据

C.非结构化数据

D.线性数据

【答案】:D

解析:大数据的主要数据

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档