2025最新大数据分析师历年真题真题及答案.docxVIP

  • 1
  • 0
  • 约5.21千字
  • 约 16页
  • 2026-05-06 发布于四川
  • 举报

2025最新大数据分析师历年真题真题及答案.docx

2025最新大数据分析师历年练习题练习题及答案

一、单项选择题(每题2分,共30分)

1.以下哪种数据存储方式适合存储大规模的非结构化数据?

A.关系型数据库

B.数据仓库

C.分布式文件系统(如HDFS)

D.内存数据库

答案:C。分布式文件系统(如HDFS)具有高可扩展性和容错性,适合存储大规模的非结构化数据。关系型数据库主要用于结构化数据存储;数据仓库是对多个数据源进行整合和分析的系统;内存数据库主要用于对数据读写速度要求极高的场景。

2.在Hadoop生态系统中,用于资源管理和任务调度的组件是?

A.HDFS

B.MapReduce

C.YARN

D.HBase

答案:C。YARN负责Hadoop集群中的资源管理和任务调度。HDFS是分布式文件系统;MapReduce是一种编程模型,用于大规模数据的并行处理;HBase是分布式的、面向列的开源数据库。

3.已知数据集{1,2,3,4,5},其均值和中位数分别是?

A.3,3

B.3,4

C.2.5,3

D.2.5,2.5

答案:A。均值为(1+2+3+4+5)/5=3;将数据集从小到大排序为{1,2,3,4,5},中间的数是3,即中位数是3。

4.以下哪种算法属于无监督学习算法?

A.逻辑回归

B.决策树

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档