2026年国开电大大数据技术概论形考题库100道【轻巧夺冠】.docxVIP

  • 0
  • 0
  • 约2.43万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道【轻巧夺冠】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、在大数据分析流程中,数据清洗的主要目的是?

A.去除噪声数据和异常值

B.将数据转换为结构化格式

C.对数据进行加密保护

D.提升数据的计算效率

【答案】:A

解析:本题考察数据预处理知识点。数据清洗主要处理数据质量问题,核心是去除缺失值、噪声数据和异常值,确保数据准确性。选项B属于数据转换步骤,C属于数据安全范畴,D是数据压缩等优化的目标,均非数据清洗的目的。因此正确答案为A。

2、大数据的“Volume”特征主要描述的是数据的什么特性?

A.数据量巨大

B.处理速度快

C.数据类型多样

D.数据价值密度高

【答案】:A

解析:本题考察大数据5V特征知识点。大数据的5V特征中,“Volume”特指数据量巨大(如PB级、EB级);B选项“处理速度快”对应“Velocity”特征;C选项“数据类型多样”对应“Variety”特征;D选项“数据价值密度高”描述错误,大数据的“Value”特征实际是“价值密度低”(需通过挖掘提取价值)。因此正确答案为A。

3、在大数据处理流程中,以下哪项工作不属于数据清洗阶段的内容?

A.处理数据中的缺失值

B.去除重复的记录

C.对数据进行标准化处理

D.识别并移除异常值

【答案】:C

解析:本题考察数据预处理中“数据清洗”的范围。数据清洗聚焦原始数据质量问题,包括处理缺失值(A)、重复值(B)、异常值(D)等;数据标准化(C)属于“数据转换/特征工程”环节,用于统一数据格式或范围,因此不属于清洗阶段。

4、大数据的5V特征中,强调数据真实性和可信度的是以下哪一项?

A.Volume(规模)

B.Velocity(速度)

C.Veracity(真实性)

D.Value(价值)

【答案】:C

解析:本题考察大数据5V特征的定义。Volume指数据规模(如TB/PB级);Velocity指数据产生和处理的速度;Veracity强调数据的真实性和可信度(如数据清洗后确保的准确性);Value指数据的价值密度。因此正确答案为C,其他选项分别对应不同特征,不符合题干描述。

5、以下哪项不属于大数据的典型数据采集来源?

A.电商平台用户行为日志(点击、购买记录)

B.物联网传感器实时采集的环境数据

C.企业内部ERP系统的业务交易数据

D.纸质文档通过OCR扫描生成的图片文件

【答案】:D

解析:本题考察大数据数据采集来源知识点,A、B、C均为大数据典型采集来源(用户行为、物联网、企业业务数据);D中纸质文档扫描图片属于非结构化数据,需额外处理且非‘典型’实时/大量数据采集场景,故不属于典型来源。

6、大数据的“Velocity”特性对应的中文含义是?

A.规模

B.速度

C.多样性

D.价值

【答案】:B

解析:本题考察大数据的5V特性知识点。大数据的5V特性包括Volume(规模)、Velocity(速度)、Variety(多样性)、Veracity(真实性)、Value(价值)。其中“Velocity”的中文含义为“速度”,描述数据产生和处理的快速性;A选项“规模”对应Volume,C选项“多样性”对应Variety,D选项“价值”对应Value。因此正确答案为B。

7、以下哪项是Hadoop生态系统中负责分布式存储的核心组件?

A.HDFS

B.MapReduce

C.Spark

D.YARN

【答案】:A

解析:本题考察Hadoop生态系统的核心组件功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,负责海量数据的存储;B选项MapReduce是批处理计算框架,C选项Spark是内存计算框架,D选项YARN是资源管理器,因此正确答案为A。

8、下列哪项不属于大数据技术在现实生活中的典型应用?

A.电商平台的个性化商品推荐系统

B.城市交通流量实时监控与智能调度

C.传统纸质图书借阅管理系统

D.金融机构的风险控制与欺诈检测

【答案】:C

解析:本题考察大数据典型应用场景。大数据应用依赖海量数据的采集、分析与智能化处理。A(电商推荐)、B(交通调度)、D(金融风控)均通过大数据技术实现(基于用户行为、实时路况、交易数据等)。C选项“传统纸质图书借阅管理”依赖人工或简单数据库,未涉及大数据技术的核心特征(海量、高速、多样等),属于传统管理方式,不符合题意。

9、大数据的4V特征中,描述数据产生和处理速度的是以下哪个特征?

A.Volume(数据量)

B.Velocity(速度)

C.Variety(多样性)

D.Value(价值密度)

【答案】:B

解析:本题考察大数据4V特

文档评论(0)

1亿VIP精品文档

相关文档