2026年国开电大大数据技术形考题库100道及参考答案【综合卷】.docxVIP

  • 0
  • 0
  • 约2.51万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道及参考答案【综合卷】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪项不属于大数据在金融领域的典型应用?

A.信用评分

B.风险控制

C.智能投顾

D.基因测序

【答案】:D

解析:本题考察大数据的典型应用场景。大数据在金融领域广泛应用于信用评分(通过多维度数据评估信用)、风险控制(实时监控异常交易)、智能投顾(基于用户数据和市场数据推荐投资组合)。而基因测序属于生物医疗领域的大数据应用,因此正确答案为D。

2、在大数据预处理中,当数据集中存在大量缺失值且数据类型为数值型时,最常用的处理方法是?

A.直接删除所有包含缺失值的样本

B.使用均值填充缺失值

C.使用众数填充缺失值

D.使用KNN算法进行缺失值预测

【答案】:B

解析:本题考察大数据数据预处理中缺失值处理的知识点。对于数值型数据,均值填充是最常用的缺失值处理方法(均值对整体趋势拟合较好);众数填充主要适用于类别型数据;直接删除会丢失大量数据信息,降低数据完整性;KNN算法属于复杂的机器学习方法,在大数据预处理中较少作为基础缺失值处理手段。因此正确答案为B。

3、大数据的4V特征中,不包含以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Veracity(真实性)

【答案】:D

解析:本题考察大数据4V特征知识点,大数据经典4V特征为Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值),而Veracity(真实性)属于大数据扩展特征(5V中的第五个V),因此4V特征中不包含D选项,正确答案为D。

4、以下哪项不属于大数据的基本特征?

A.Volume(数据量大)

B.Velocity(处理速度快)

C.Veracity(数据真实性)

D.Value(价值密度低)

【答案】:C

解析:本题考察大数据的基本特征知识点。大数据的经典4V特征包括Volume(数据量大)、Velocity(数据产生和处理速度快)、Variety(数据类型多样)、Value(低价值密度)。选项C“Veracity(数据真实性)”并非大数据的基础特征,更多属于数据质量评估范畴,因此正确答案为C。

5、以下哪种算法属于无监督学习中的聚类算法?

A.逻辑回归(监督分类算法)

B.决策树(监督分类/回归算法)

C.K-means(无监督聚类算法)

D.支持向量机(SVM,监督分类算法)

【答案】:C

解析:K-means通过距离度量将无标签数据自动划分成K个簇,属于无监督聚类算法;逻辑回归、决策树、SVM均为监督学习算法(需标签数据),用于分类或回归任务。因此答案为C。

6、以下哪项是Hadoop分布式文件系统的核心组件?

A.HDFS

B.MapReduce

C.YARN

D.Spark

【答案】:A

解析:本题考察Hadoop生态系统核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop分布式文件系统,负责数据的分布式存储;MapReduce是分布式计算框架,YARN是资源管理器,Spark是独立的内存计算引擎,因此答案为A。

7、大数据的核心特征“4V”不包括以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Viscosity(粘度)

【答案】:D

解析:本题考察大数据的“4V”核心特征知识点。大数据的“4V”特征包括:Volume(数据容量大)、Velocity(数据产生和处理速度快)、Variety(数据类型多样,如结构化、半结构化、非结构化)、Value(数据价值密度低但通过分析可挖掘高价值)。选项D中的“Viscosity(粘度)”并非大数据特征,属于错误选项。

8、以下哪种技术适用于实时流数据处理?

A.MapReduce(批处理框架)

B.SparkStreaming(流处理框架)

C.Hive(数据仓库工具)

D.HBase(分布式NoSQL数据库)

【答案】:B

解析:本题考察大数据处理技术应用场景知识点。SparkStreaming是专为实时流数据设计的框架,可对持续产生的数据流进行毫秒级或秒级实时分析;A选项MapReduce是经典批处理框架,适用于离线海量数据计算;C选项Hive基于批处理引擎(如MapReduce),主要用于离线数据分析;D选项HBase是分布式数据库,用于存储非结构化数据而非处理流数据。因此正确答案为B。

9、在数据挖掘算法中,以下哪一项属于无监督学习算法?

A.K-Means聚类算法

B.支持向量机(SVM)

C.决策树

D.逻辑回归

【答案】:A

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档