- 0
- 0
- 约2.41万字
- 约 38页
- 2026-03-09 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、在Hadoop生态系统中,负责分布式存储海量数据的核心组件是?
A.HDFS(分布式文件系统)
B.MapReduce(分布式计算框架)
C.YARN(资源管理器)
D.Hive(数据仓库工具)
【答案】:A
解析:本题考察Hadoop生态系统核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,主要负责海量数据的分布式存储;B选项MapReduce是分布式计算框架,C选项YARN是资源管理器,D选项Hive是基于Hadoop的数据仓库工具,均不负责分布式存储。因此正确答案为A。
2、Hadoop生态系统中,负责存储海量数据的核心分布式文件系统是?
A.HDFS(HadoopDistributedFileSystem)
B.MapReduce(分布式计算框架)
C.YARN(资源管理器)
D.Hive(数据仓库工具)
【答案】:A
解析:本题考察Hadoop生态系统核心组件知识点。Hadoop的核心分布式文件系统是HDFS,用于存储海量数据;B选项MapReduce是分布式计算框架,负责并行计算任务;C选项YARN是资源管理器,管理集群资源;D选项Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。因此正确答案为A。
3、以下哪种技术常用于大数据传输过程中的安全加密?
A.AES加密
B.SSL/TLS协议
C.MD5哈希算法
D.RSA加密
【答案】:B
解析:本题考察大数据安全传输技术。SSL/TLS(安全套接层/传输层安全)是专门用于网络传输层的数据加密协议,保障数据在传输过程中的安全性;A选项AES是对称加密算法,多用于数据存储加密;C选项MD5是单向哈希算法,仅用于数据校验而非加密;D选项RSA是非对称加密算法,常用于身份认证或小数据量加密,不直接用于传输层大规模数据加密。
4、以下哪种算法属于无监督学习?
A.线性回归(有监督,预测连续值)
B.K-Means(无监督,聚类算法)
C.逻辑回归(有监督,分类算法)
D.决策树(有监督,分类/回归算法)
【答案】:B
解析:本题考察机器学习算法类型。无监督学习无需标签数据,K-Means通过数据特征自动分组(聚类);A、C、D均为有监督学习(需训练标签数据),线性回归用于预测连续值,逻辑回归和决策树用于分类任务,因此B选项正确。
5、K-means算法在数据挖掘中主要用于解决以下哪种任务?
A.分类(Classification)
B.聚类(Clustering)
C.关联规则挖掘(AssociationRuleMining)
D.回归分析(RegressionAnalysis)
【答案】:B
解析:本题考察数据挖掘算法类型。K-means是经典的无监督学习聚类算法,通过距离度量将数据划分为K个簇(cluster);选项A的分类需预先定义类别标签(如决策树、SVM),属于有监督学习;选项C的关联规则挖掘(如Apriori)用于发现数据项之间的关联关系(如“啤酒与尿布”);选项D的回归分析用于预测连续数值(如线性回归)。因此,K-means属于聚类任务,正确答案为B。
6、大数据的5V特征中,“Velocity”指的是?
A.数据处理的速度(数据产生和流动的速度)
B.数据的规模(数据量大小)
C.数据的多样性(结构化与非结构化数据并存)
D.数据的价值密度(数据蕴含的价值)
【答案】:A
解析:本题考察大数据的5V特征知识点。大数据的5V特征分别是Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(准确性)、Value(价值)。选项A准确描述了Velocity的含义;B对应Volume,C对应Variety,D对应Value,均为错误选项。
7、在大数据技术架构中,负责对数据进行分布式并行计算的是哪一层?
A.基础设施层
B.数据存储层
C.数据处理层
D.数据应用层
【答案】:C
解析:大数据技术架构通常分为四层:基础设施层(提供硬件、虚拟化等基础资源)、数据存储层(存储结构化/非结构化数据)、数据处理层(对数据进行分布式并行计算,含批处理、流处理等)、数据应用层(基于处理后的数据进行分析、可视化等)。选项C“数据处理层”负责计算任务,因此正确答案为C。
8、在大数据处理的预处理阶段,以下哪个操作主要用于处理数据中的缺失值和异常值?
A.数据清洗
B.数据集成
C.数据转换
D.数据可视化
【答案】:A
解析:本题考察数据预处理操作知识点。数据清洗是预处理的关键步骤,主要用于处理数
您可能关注的文档
- 2026年国开电大当代中国政治制度形考题库100道附完整答案(名师系列).docx
- 2026年国开电大当代中国政治制度形考题库100道含完整答案(易错题).docx
- 2026年国开电大当代世界经济与政治形考题库100道带答案.docx
- 2026年国开电大当代世界经济与政治形考题库100道及完整答案(历年真题).docx
- 2026年国开电大导游业务形考题库100道附参考答案【达标题】.docx
- 2026年国开电大导游业务形考题库100道及参考答案(最新).docx
- 2026年国开电大大数据技术形考题库100道附参考答案(综合卷).docx
- 2026年国开电大大作业形考题库100道附答案(实用).docx
- 2026年国开电大大作业形考题库100道含答案【研优卷】.docx
- 2026年国开电大创新思维训练与方法形考题库100道附参考答案(完整版).docx
原创力文档

文档评论(0)