2026年国开电大大数据技术形考题库100道及参考答案【b卷】.docxVIP

  • 0
  • 0
  • 约2.52万字
  • 约 40页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道及参考答案【b卷】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、大数据的“4V”特征中,描述数据产生和处理速度快的是哪个特征?

A.Volume(数据容量)

B.Variety(数据多样性)

C.Velocity(数据速度)

D.Veracity(数据真实性)

【答案】:C

解析:本题考察大数据的基本特征知识点。大数据“4V”特征中,Velocity特指数据产生和处理的速度(如实时流数据处理);Volume指数据规模巨大,Variety指数据类型多样(结构化、半结构化、非结构化),Veracity是数据质量维度(真实性),通常不属于4V核心特征。

2、大数据的5V特征中,不包括以下哪一项?

A.Volume

B.Velocity

C.Viscosity

D.Variety

【答案】:C

解析:本题考察大数据5V特征知识点。大数据的5V特征为Volume(数量)、Velocity(速度)、Variety(多样性)、Value(价值)、Veracity(真实性)。选项C的Viscosity(粘度)并非5V特征之一,属于干扰项。正确答案为C。

3、以下哪个场景属于大数据在‘精准营销’领域的典型应用?

A.电商平台根据用户浏览记录推荐商品

B.交通部门实时监控城市路况并调度车辆

C.气象部门通过历史数据预测未来一周天气

D.医院利用病历数据分析患者疾病特征

【答案】:A

解析:本题考察大数据应用场景的知识点。‘精准营销’核心是通过数据分析精准匹配用户需求与产品。选项A中电商平台基于用户行为数据(浏览记录)推荐商品,直接利用大数据实现个性化营销;选项B属于交通管理领域的实时监控,C属于气象预测,D属于医疗数据分析,均不属于精准营销。因此正确答案为A。

4、数据预处理的典型步骤中,不包括以下哪项?

A.数据清洗(处理缺失值、异常值)

B.数据集成(合并多源数据)

C.数据转换(格式转换、标准化)

D.数据压缩(减少数据存储空间)

【答案】:D

解析:本题考察数据预处理知识点。数据预处理是大数据分析前的关键步骤,包括数据清洗(A选项,处理数据质量问题)、数据集成(B选项,合并多源数据)、数据转换(C选项,调整数据格式或标准化);而数据压缩(D选项)主要用于数据存储优化,不属于预处理的典型步骤(预处理更关注数据质量与可用性,而非存储压缩)。因此正确答案为D。

5、在大数据预处理流程中,去除数据中的重复记录、填补缺失值属于哪个步骤?

A.数据清洗(处理脏数据)

B.数据集成(合并多源数据)

C.数据转换(格式与特征转换)

D.数据规约(降维与特征选择)

【答案】:A

解析:本题考察大数据预处理步骤的定义。数据预处理是数据质量提升的关键环节,各步骤功能如下:数据清洗(处理噪声、缺失值、重复记录等“脏数据”)、数据集成(合并不同数据源)、数据转换(如归一化、编码转换)、数据规约(减少数据规模但保留核心信息)。去除重复记录和填补缺失值属于数据清洗的典型操作,因此答案为A。

6、Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.MapReduce(分布式计算框架)

B.HDFS(分布式文件系统)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:B

解析:本题考察Hadoop核心组件功能。HDFS(HadoopDistributedFileSystem)是分布式文件系统,负责海量数据的分布式存储;A选项MapReduce是分布式计算框架,C选项YARN负责资源调度与管理,D选项Hive是基于Hadoop的数据仓库工具。因此正确答案为B。

7、Hadoop分布式文件系统(HDFS)采用副本机制的主要目的是?

A.提高数据存储容量

B.保障数据可靠性和读取效率

C.加速数据传输速度

D.降低数据压缩成本

【答案】:B

解析:本题考察Hadoop分布式文件系统(HDFS)的核心机制知识点。HDFS的副本机制是指将数据在多个数据节点上存储多个副本(默认3个),其核心目的包括:①数据可靠性:当单个节点故障时,副本可替代故障节点数据,避免数据丢失;②读取效率:多个副本可并行读取,提升数据读取速度。选项A“存储容量”并非核心目的(副本会占用额外空间);选项C“数据传输速度”与副本机制无关;选项D“数据压缩成本”与副本机制无关。因此正确答案为B。

8、数据预处理阶段中,用于处理数据缺失值、异常值和重复数据的步骤是?

A.数据清洗

B.数据集成

C.数据转换

D.数据规约

【答案】:A

解析:本题考察数据预处理步骤知识点。数据清洗的核心作用是处理数据中的质量问题,包括缺失值填充、异常值修正、重复数据删除等;B选项数据集成是合并多个数据源

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档