2026年国开电大大数据技术形考题库100道附参考答案【完整版】.docxVIP

  • 1
  • 0
  • 约2.45万字
  • 约 38页
  • 2026-03-11 发布于山东
  • 举报

2026年国开电大大数据技术形考题库100道附参考答案【完整版】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、关于数据仓库与数据湖的区别,以下说法正确的是?

A.数据仓库仅存储结构化数据,数据湖可存储多种类型数据

B.数据仓库存储实时数据,数据湖仅存储历史数据

C.数据仓库适合实时分析,数据湖适合离线批处理分析

D.数据仓库和数据湖本质上没有区别,仅为名称差异

【答案】:A

解析:本题考察数据仓库与数据湖的核心概念。数据仓库通常基于结构化数据,面向分析场景,经过清洗和整合;数据湖则是原始数据集合,支持存储结构化、半结构化和非结构化数据,保留原始数据形态。B选项错误,两者均可存储实时和历史数据;C选项错误,两者均支持实时或批处理分析;D选项错误,两者在数据存储方式、应用场景上有本质区别。因此正确答案为A。

2、大数据技术在以下哪个行业的精准营销应用最广泛?

A.金融行业

B.传统制造业

C.农业种植

D.传统零售业

【答案】:A

解析:本题考察大数据技术的行业应用场景。金融行业(如银行、保险)通过大数据分析客户交易行为、信用记录、风险偏好等,可实现精准风控、个性化理财产品推荐等。A选项符合题意。B选项“传统制造业”更多依赖物联网、工业互联网优化生产流程;C选项“农业种植”数据规模较小,大数据应用场景有限;D选项“传统零售业”虽有数据应用,但相比金融行业的精准营销需求(如用户画像、风险评估),应用深度和广度较弱。因此正确答案为A。

3、国开电大大数据技术课程中常见的企业级数据可视化与商业智能(BI)工具是?

A.Tableau

B.Python的NumPy库

C.MySQL数据库

D.Hadoop分布式框架

【答案】:A

解析:本题考察大数据可视化工具的应用。Tableau(A选项)是企业级数据可视化与BI工具,支持拖拽式分析和丰富图表展示;NumPy(B选项)是Python数值计算库,不侧重可视化;MySQL(C选项)是关系型数据库,用于数据存储而非可视化;Hadoop(D选项)是分布式计算框架,不直接用于可视化。因此正确答案为Tableau。

4、K-means算法在数据挖掘中主要用于解决以下哪种任务?

A.分类(Classification)

B.聚类(Clustering)

C.关联规则挖掘(AssociationRuleMining)

D.回归分析(RegressionAnalysis)

【答案】:B

解析:本题考察数据挖掘算法类型。K-means是经典的无监督学习聚类算法,通过距离度量将数据划分为K个簇(cluster);选项A的分类需预先定义类别标签(如决策树、SVM),属于有监督学习;选项C的关联规则挖掘(如Apriori)用于发现数据项之间的关联关系(如“啤酒与尿布”);选项D的回归分析用于预测连续数值(如线性回归)。因此,K-means属于聚类任务,正确答案为B。

5、Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.MapReduce

B.YARN

C.HDFS

D.Hive

【答案】:C

解析:HDFS(HadoopDistributedFileSystem)是Hadoop生态系统中专门负责分布式数据存储的核心组件,通过多副本机制保障数据可靠性;MapReduce是分布式计算框架,YARN负责资源管理与任务调度,Hive是数据仓库工具,主要用于数据查询与分析,故正确答案为C。

6、以下哪项不属于大数据的基本特征?

A.Volume

B.Velocity

C.Value

D.Variability

【答案】:D

解析:大数据的基本特征通常概括为4V:Volume(数据量大)、Velocity(处理速度快)、Variety(数据类型多样)、Value(价值密度低)。而Variability(变异性)并非大数据的核心定义特征,因此D选项错误。

7、大数据的4V特征中,不包括以下哪一项?

A.多样性(Variety)

B.可变性(Variability)

C.速度(Velocity)

D.价值(Value)

【答案】:B

解析:本题考察大数据的4V核心特征知识点。大数据的4V特征包括Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值)。选项B的“可变性”并非大数据4V特征之一,属于干扰项,因此正确答案为B。

8、以下哪个Python库主要用于机器学习模型的构建与训练?

A.Pandas(数据处理)

B.NumPy(数值计算)

C.Scikit-learn(机器学习)

D.TensorFlow(深度学习)

【答案】:C

解析:本题考察Python大数据分析库的功能。选项A的Pandas是数据清洗、转换和分

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档