南京大学《大数据实时计算技术》2023-2024学年第二学期期末试卷.docVIP

  • 0
  • 0
  • 约2.97千字
  • 约 5页
  • 2026-06-25 发布于重庆
  • 举报

南京大学《大数据实时计算技术》2023-2024学年第二学期期末试卷.doc

装订线

装订线

PAGE2

第PAGE1页,共NUMPAGES3页

南京大学

《大数据实时计算技术》2023-2024学年第二学期期末试卷

院(系)_______班级_______学号_______姓名_______

题号

总分

得分

批阅人

一、单选题(本大题共15个小题,每小题2分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、在大数据存储中,副本机制常用于提高数据的可靠性和可用性。假设一个分布式存储系统中有一份数据存在三个副本。以下关于副本管理的描述,正确的是:()

A.副本应存储在同一物理位置,便于管理和维护

B.副本之间应保持完全同步,以确保数据一致性

C.可以根据节点的负载和网络状况动态调整副本的位置

D.副本数量越多越好,能最大限度保证数据安全

2、在进行大数据分析时,经常需要对数据进行特征工程。以下关于特征工程的描述,错误的是?()

A.特征工程旨在从原始数据中提取有意义的特征

B.特征工程可以提高数据分析模型的准确性

C.特征工程只适用于有监督学习算法

D.特征选择和特征构建是特征工程的重要步骤

3、在大数据项目中,数据预处理通常包括数据清洗、转换和集成等步骤。如果数据来自多个不同的数据源,且数据格式不一致,首先需要进行的操作是?()

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档