2026年国开电大大数据技术形考题库100道含答案(培优a卷) (2).docxVIP

  • 0
  • 0
  • 约2.39万字
  • 约 38页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道含答案(培优a卷) (2).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、下列哪种技术适用于处理实时数据流(如传感器实时监控数据)?

A.HadoopMapReduce(批处理)

B.SparkStreaming(流处理)

C.Hive(离线SQL分析)

D.HBase(分布式存储)

【答案】:B

解析:本题考察大数据处理技术场景。A选项MapReduce是离线批处理框架,适合海量历史数据计算;B选项SparkStreaming是实时流处理引擎,支持毫秒级延迟的实时数据处理;C选项Hive基于HDFS的SQL分析工具,适用于离线批处理;D选项HBase是分布式NoSQL数据库,用于存储非结构化数据。因此正确答案为B。

2、以下哪种算法属于数据挖掘中的聚类算法?

A.线性回归

B.K-Means

C.决策树

D.Apriori

【答案】:B

解析:K-Means是典型的聚类算法,通过最小化簇内距离将数据自动分组为不同簇;线性回归是预测连续值的回归算法,决策树是分类算法,Apriori是关联规则挖掘算法(用于发现数据项间关联关系,如“啤酒与尿布”),故正确答案为B。

3、在大数据技术应用中,用于实时流数据处理的开源框架是?

A.SparkStreaming

B.Hadoop

C.Hive

D.HBase

【答案】:A

解析:本题考察大数据实时处理框架知识点。SparkStreaming是Spark生态系统中处理实时流数据的组件,支持高吞吐量和低延迟;Hadoop是批处理框架,侧重离线数据处理;Hive是基于Hadoop的数据仓库工具,用于SQL式查询;HBase是分布式NoSQL数据库,侧重存储而非实时流处理。因此正确答案为A。

4、以下哪项不属于大数据的基本特征?

A.Volume(数据量大)

B.Velocity(处理速度快)

C.Veracity(数据真实性)

D.Value(价值密度低)

【答案】:C

解析:本题考察大数据的基本特征知识点。大数据的经典4V特征包括Volume(数据量大)、Velocity(数据产生和处理速度快)、Variety(数据类型多样)、Value(低价值密度)。选项C“Veracity(数据真实性)”并非大数据的基础特征,更多属于数据质量评估范畴,因此正确答案为C。

5、在大数据预处理中,以下哪种方法不属于处理缺失值的常用手段?

A.删除包含缺失值的记录

B.使用均值/中位数进行插补

C.直接忽略缺失数据

D.通过KNN算法预测缺失值

【答案】:C

解析:本题考察数据预处理中缺失值处理方法。常用缺失值处理方法包括A(删除)、B(统计量插补)、D(基于模型预测);C选项“直接忽略数据”不符合数据处理规范,会导致数据信息损失且缺乏系统性。因此正确答案为C。

6、大数据的5V特征中,描述数据价值密度低的特征是以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Value(价值密度高)

【答案】:D

解析:本题考察大数据的5V特征知识点。大数据的5V特征包括Volume(数据量大)、Velocity(处理速度快)、Variety(数据类型多样)、Value(价值密度低)、Veracity(数据真实性)。选项D中“价值密度高”与大数据实际特征不符,大数据中大部分数据原始价值密度低,需通过挖掘分析提升价值,因此正确答案为D。

7、大数据预处理阶段中,用于处理数据中的缺失值、异常值和重复数据的关键步骤是?

A.数据采集(DataCollection)

B.数据清洗(DataCleaning)

C.数据集成(DataIntegration)

D.数据转换(DataTransformation)

【答案】:B

解析:本题考察大数据预处理流程知识点。数据清洗的核心是处理数据质量问题,包括缺失值填充、异常值处理、重复数据去重等;选项A的数据采集是获取原始数据的过程,不涉及清洗;选项C的数据集成是合并多源数据,需先清洗再集成;选项D的数据转换是对数据格式、结构进行转换(如标准化),与处理缺失/异常值无关。因此,正确答案为B。

8、大数据的5V特征中,不包括以下哪一项?

A.Volume

B.Velocity

C.Variety

D.Validity

【答案】:D

解析:本题考察大数据的5V特征知识点。大数据的5V特征包括Volume(数据容量)、Velocity(数据产生速度)、Variety(数据多样性)、Veracity(数据真实性)、Value(数据价值)。选项D的Validity(有效性)并非大数据5V特征之一,因此正确答案为D。

9、大数据技术在金融领域的

文档评论(0)

1亿VIP精品文档

相关文档