2026年国开电大大数据技术概论形考题库100道(基础题).docxVIP

  • 0
  • 0
  • 约2.43万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道(基础题).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、下列哪项属于大数据在精准医疗领域的应用?

A.基于用户浏览历史的商品推荐

B.通过分析基因数据预测疾病风险

C.实时监控城市交通流量

D.优化电商物流配送路径

【答案】:B

解析:本题考察大数据应用场景知识点。精准医疗通过分析基因、病历等多维度数据预测疾病风险,属于大数据在医疗领域的典型应用;A选项是电商智能推荐(用户画像应用);C选项是智慧城市交通监控(物联网+大数据);D选项是物流路径优化(供应链管理应用)。因此正确答案为B。

2、在Hadoop生态系统中,负责存储海量分布式数据的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察Hadoop生态系统组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专为存储海量数据设计,支持大文件和高容错性;MapReduce是分布式计算框架,负责并行处理数据;YARN负责集群资源管理和任务调度;Hive是基于Hadoop的数据仓库工具,用于SQL类查询。因此正确答案为A。

3、在数据类型分类中,以下属于非结构化数据的是?

A.关系型数据库表中的数据

B.纯文本文件(如.txt格式)

C.XML格式的数据

D.JSON格式的数据

【答案】:B

解析:本题考察数据类型的概念,正确答案为B。非结构化数据无固定数据模型,难以用二维表结构表示,纯文本文件(如.txt)通常无预定义格式,属于非结构化数据;A选项关系型数据库表数据是结构化数据(有明确字段和表结构);C选项XML和D选项JSON属于半结构化数据(有一定结构但非严格关系型),因此B为正确答案。

4、大数据的“Velocity”特性对应的中文含义是?

A.规模

B.速度

C.多样性

D.价值

【答案】:B

解析:本题考察大数据的5V特性知识点。大数据的5V特性包括Volume(规模)、Velocity(速度)、Variety(多样性)、Veracity(真实性)、Value(价值)。其中“Velocity”的中文含义为“速度”,描述数据产生和处理的快速性;A选项“规模”对应Volume,C选项“多样性”对应Variety,D选项“价值”对应Value。因此正确答案为B。

5、Hadoop生态系统中用于分布式文件存储的核心组件是?

A.HDFS

B.MapReduce

C.YARN

D.Hive

【答案】:A

解析:本题考察Hadoop生态系统组件功能。选项A的HDFS(HadoopDistributedFileSystem)是Hadoop分布式文件系统,用于大规模数据的分布式存储;选项B的MapReduce是分布式计算框架,负责数据处理;选项C的YARN是资源管理器,负责集群资源调度;选项D的Hive是数据仓库工具,用于数据查询与分析。因此正确答案为A。

6、大数据预处理阶段中,处理数据缺失值时,直接删除包含缺失值的样本属于哪种方法?

A.均值插补法

B.删除法

C.中位数插补法

D.众数插补法

【答案】:B

解析:本题考察数据预处理方法知识点。缺失值处理方法包括:删除法(直接删除含缺失值的样本,可能导致数据量减少)、插补法(用均值、中位数、众数等填充缺失值)。选项A、C、D均属于插补法,因此正确答案为B。

7、大数据的4V特征中,不包含以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Validity(有效性)

【答案】:D

解析:本题考察大数据的核心特征(4V)知识点。大数据的4V特征是指Volume(数据量)、Velocity(数据产生速度)、Variety(数据多样性)和Value(数据价值),而Validity(有效性)并非4V特征之一。因此正确答案为D,A、B、C均为4V特征的核心内容。

8、以下哪种技术常作为大数据处理的底层支撑平台,提供弹性计算和存储能力?

A.云计算

B.物联网

C.人工智能

D.区块链

【答案】:A

解析:本题考察大数据底层支撑技术知识点。云计算通过分布式存储与计算资源池化,提供弹性扩展的算力与存储能力,是大数据处理(如Hadoop、Spark等)的底层基础设施。B选项物联网是大数据的重要数据来源(如传感器数据);C选项人工智能是大数据的应用方向(如机器学习模型训练);D选项区块链主要用于分布式账本与信任机制,与大数据处理的底层支撑关联较弱。

9、大数据分析的最终目标是?

A.实现数据的高效存储

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档