- 1
- 0
- 约2.45万字
- 约 38页
- 2026-03-11 发布于山东
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、关于数据仓库与数据湖的区别,以下说法正确的是?
A.数据仓库仅存储结构化数据,数据湖可存储多种类型数据
B.数据仓库存储实时数据,数据湖仅存储历史数据
C.数据仓库适合实时分析,数据湖适合离线批处理分析
D.数据仓库和数据湖本质上没有区别,仅为名称差异
【答案】:A
解析:本题考察数据仓库与数据湖的核心概念。数据仓库通常基于结构化数据,面向分析场景,经过清洗和整合;数据湖则是原始数据集合,支持存储结构化、半结构化和非结构化数据,保留原始数据形态。B选项错误,两者均可存储实时和历史数据;C选项错误,两者均支持实时或批处理分析;D选项错误,两者在数据存储方式、应用场景上有本质区别。因此正确答案为A。
2、大数据技术在以下哪个行业的精准营销应用最广泛?
A.金融行业
B.传统制造业
C.农业种植
D.传统零售业
【答案】:A
解析:本题考察大数据技术的行业应用场景。金融行业(如银行、保险)通过大数据分析客户交易行为、信用记录、风险偏好等,可实现精准风控、个性化理财产品推荐等。A选项符合题意。B选项“传统制造业”更多依赖物联网、工业互联网优化生产流程;C选项“农业种植”数据规模较小,大数据应用场景有限;D选项“传统零售业”虽有数据应用,但相比金融行业的精准营销需求(如用户画像、风险评估),应用深度和广度较弱。因此正确答案为A。
3、国开电大大数据技术课程中常见的企业级数据可视化与商业智能(BI)工具是?
A.Tableau
B.Python的NumPy库
C.MySQL数据库
D.Hadoop分布式框架
【答案】:A
解析:本题考察大数据可视化工具的应用。Tableau(A选项)是企业级数据可视化与BI工具,支持拖拽式分析和丰富图表展示;NumPy(B选项)是Python数值计算库,不侧重可视化;MySQL(C选项)是关系型数据库,用于数据存储而非可视化;Hadoop(D选项)是分布式计算框架,不直接用于可视化。因此正确答案为Tableau。
4、K-means算法在数据挖掘中主要用于解决以下哪种任务?
A.分类(Classification)
B.聚类(Clustering)
C.关联规则挖掘(AssociationRuleMining)
D.回归分析(RegressionAnalysis)
【答案】:B
解析:本题考察数据挖掘算法类型。K-means是经典的无监督学习聚类算法,通过距离度量将数据划分为K个簇(cluster);选项A的分类需预先定义类别标签(如决策树、SVM),属于有监督学习;选项C的关联规则挖掘(如Apriori)用于发现数据项之间的关联关系(如“啤酒与尿布”);选项D的回归分析用于预测连续数值(如线性回归)。因此,K-means属于聚类任务,正确答案为B。
5、Hadoop生态系统中,负责分布式数据存储的核心组件是?
A.MapReduce
B.YARN
C.HDFS
D.Hive
【答案】:C
解析:HDFS(HadoopDistributedFileSystem)是Hadoop生态系统中专门负责分布式数据存储的核心组件,通过多副本机制保障数据可靠性;MapReduce是分布式计算框架,YARN负责资源管理与任务调度,Hive是数据仓库工具,主要用于数据查询与分析,故正确答案为C。
6、以下哪项不属于大数据的基本特征?
A.Volume
B.Velocity
C.Value
D.Variability
【答案】:D
解析:大数据的基本特征通常概括为4V:Volume(数据量大)、Velocity(处理速度快)、Variety(数据类型多样)、Value(价值密度低)。而Variability(变异性)并非大数据的核心定义特征,因此D选项错误。
7、大数据的4V特征中,不包括以下哪一项?
A.多样性(Variety)
B.可变性(Variability)
C.速度(Velocity)
D.价值(Value)
【答案】:B
解析:本题考察大数据的4V核心特征知识点。大数据的4V特征包括Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值)。选项B的“可变性”并非大数据4V特征之一,属于干扰项,因此正确答案为B。
8、以下哪个Python库主要用于机器学习模型的构建与训练?
A.Pandas(数据处理)
B.NumPy(数值计算)
C.Scikit-learn(机器学习)
D.TensorFlow(深度学习)
【答案】:C
解析:本题考察Python大数据分析库的功能。选项A的Pandas是数据清洗、转换和分
您可能关注的文档
- 220千伏甘陈站110千伏间隔扩建工程环境影响报告表.pdf
- 广西恒利玻璃深加工生产制造项目环境影响报告表.pdf
- 武宣合群风电场二期环境影响报告书.pdf
- 广西醇盛化工甲醇储存站项目环境影响报告表.pdf
- 1500吨年对氯甲基溴乙基苯、2000 吨年对氯甲基苯乙烯扩建项目环境影响报告书.pdf
- 110kV旺村变电站扩建工程环境影响报告表.pdf
- 220kV金秀站110kV配套线路送出工程环境影响评价报告表.pdf
- 广西聚盈腾达农业有限公司项目环境影响报告书.pdf
- S210柳州来宾分界至知青点段公路改建工程环境影响报告表.pdf
- 1万吨_年生物基1,4-丁二醇项目(重新报批)报告书.pdf
- G681线阿勒泰至禾木喀纳斯公路建设项目增补观景停车区等服务设施项目环境影响报告表.pdf
- 来宾韦文林建材年产100万吨机制砂项目环境影响报告表.pdf
- 合山市高端环保免漆生态板加工项目环境影响报告表.pdf
- 3.5万吨_年生物基丁二酸及衍生物高端制造项目(重新报批)报告书.pdf
- G631淮阳区王店至周西路口段新建工程报告书.pdf
- 年产12万吨装配式智能钢结构、50万套钢结构工程机械配件智能自动化生产线项目环境影响报告书.doc
- 2024年新疆维吾尔自治区福海县渔业绿色循环发展试点-生态型活鱼育肥箱系统采购项目环境影响报告表.pdf
- 广西1828大健康产业园项目环境影响报告表.pdf
- 220千伏金秀站扩建工程环境影响报告表.pdf
- 20万吨_年聚苯乙烯产品优化提升项目报告书.pdf
原创力文档

文档评论(0)