期末大数据题库及答案.docVIP

  • 2
  • 0
  • 约4.35千字
  • 约 11页
  • 2026-06-02 发布于山东
  • 举报

期末大数据题库及答案

一、填空题(每题2分,共20分)

1.在大数据的4V特征中,______指的是数据规模巨大。

2.Hadoop的核心组件包括______、YARN和HDFS。

3.数据挖掘的常用技术有分类、聚类、关联规则挖掘和______。

4.在数据预处理中,______是指将数据转换为统一的格式。

5.MapReduce模型中,Map阶段的主要功能是______。

6.大数据技术中的NoSQL数据库主要包括键值存储、文档存储、列式存储和______。

7.数据仓库的典型架构包括数据源、数据存储、数据加工和数据展现,其中数据加工阶段通常包括ETL过程,ETL分别代表______、转换和加载。

8.在大数据分析中,常用的机器学习算法包括线性回归、决策树、支持向量机和______。

9.云计算在大数据中的应用主要体现在提供弹性计算资源和______。

10.数据湖是一种存储原始数据的系统,它通常支持______和即席查询。

二、判断题(每题2分,共20分)

1.大数据技术的主要目标是处理海量数据并从中提取有价值的信息。(√)

2.Hadoop的YARN框架主要用于资源管理和任务调度。(√)

3.数据挖掘中的分类算法主要用于预测数据所属的类别。(√)

4.数据预处理中的数据清洗主要解决数据中的缺失值和异常值问题。(√)

5.MapReduce模型

文档评论(0)

1亿VIP精品文档

相关文档