- 0
- 0
- 约4.62千字
- 约 11页
- 2026-06-04 发布于辽宁
- 举报
2026年大数据中级试题及答案
一、填空题(每题2分,共20分)
1.在大数据处理中,_________是一种分布式存储系统,用于存储大规模数据集。
2.Hadoop生态系统中的_________是用于分布式存储的非关系型数据库。
3.MapReduce编程模型中,Map函数的输出是_________。
4.大数据时代,数据挖掘的主要目的是从大量数据中发现_________。
5.数据仓库的典型架构是_________。
6.在数据预处理中,_________是指将数据转换为统一的格式。
7.机器学习中的决策树算法是一种_________学习算法。
8.在大数据分析中,_________是一种常用的数据可视化工具。
9.云计算中的_________服务提供按需使用的计算资源。
10.大数据安全中,_________是一种常用的加密技术。
二、判断题(每题2分,共20分)
1.Hadoop是一个开源的分布式存储系统。(√)
2.数据挖掘和机器学习是同一个概念。(×)
3.数据仓库是用于存储事务数据的。(×)
4.MapReduce模型中,Reduce函数可以处理多个键值对。(√)
5.数据清洗是数据预处理的一个步骤。(√)
6.决策树算法是一种监督学习算法。(√)
7.云计算中的IaaS服务提供虚拟机等计算资源。(√)
8.大数据的主要特征是数
原创力文档

文档评论(0)