新版2025年最新公需科目《大数据》考试题库(含参考答案).docxVIP

  • 0
  • 0
  • 约4.6千字
  • 约 8页
  • 2026-01-05 发布于河南
  • 举报

新版2025年最新公需科目《大数据》考试题库(含参考答案).docx

新版2025年最新公需科目《大数据》考试题库(含参考答案)

姓名:__________考号:__________

题号

总分

评分

一、单选题(共10题)

1.大数据技术中的HDFS(HadoopDistributedFileSystem)主要特点是什么?()

A.文件系统大小有限

B.高容错性

C.实时文件访问

D.强制一致性

2.在Spark中,以下哪个组件负责资源管理和任务调度?()

A.SparkSQL

B.SparkStreaming

C.SparkCore

D.SparkMLlib

3.什么是数据仓库中的OLAP?()

A.OnlineTransactionProcessing

B.OnlineAnalyticalProcessing

C.OpenDatabaseConnectivity

D.ObjectLinkingandEmbedding

4.在数据挖掘中,什么是特征工程?()

A.特征选择

B.特征提取

C.特征转换

D.以上都是

5.以下哪种数据库不遵循ACID原则?()

A.MySQL

B.MongoDB

C.PostgreSQL

D.Oracle

6.在Hadoop中,什么是YARN?()

A.YetAnotherResourceNegotiator

B.YetAnotherNetworkDevice

C.YetAnotherRecordFormat

D.YetAnotherYarnlikeNetwork

7.以下哪个算法不属于深度学习?()

A.卷积神经网络(CNN)

B.递归神经网络(RNN)

C.支持向量机(SVM)

D.随机梯度下降(SGD)

8.大数据分析中,什么是数据湖?()

A.大规模数据仓库

B.分布式文件系统

C.存储原始数据的系统

D.数据挖掘工具

9.在Hadoop生态系统中,哪个组件用于处理实时数据流?()

A.HadoopYARN

B.HadoopHDFS

C.ApacheKafka

D.ApacheHBase

10.什么是数据挖掘中的关联规则挖掘?()

A.寻找数据集中不同属性之间的关系

B.预测数据未来的趋势

C.分类数据以识别不同的类别

D.通过聚类识别数据中的相似模式

二、多选题(共5题)

11.大数据技术中,以下哪些技术属于NoSQL数据库?()

A.MongoDB

B.Redis

C.MySQL

D.HBase

12.以下哪些是大数据处理中常见的分布式计算框架?()

A.Hadoop

B.Spark

C.Kafka

D.TensorFlow

13.数据挖掘中的数据预处理步骤通常包括哪些?()

A.数据清洗

B.数据集成

C.数据变换

D.数据归一化

14.在大数据技术中,以下哪些是常见的分布式文件系统?()

A.HDFS

B.GFS

C.HBase

D.Alluxio

15.以下哪些是数据仓库中常用的数据模型?()

A.星型模式

B.雪花模式

C.多层模式

D.星型模式与雪花模式结合

三、填空题(共5题)

16.大数据技术中,Hadoop的核心组件之一是______,它负责资源管理和作业调度。

17.在数据挖掘中,______是指从原始数据中提取出有价值的、可以用于进一步分析的特征或属性。

18.大数据技术中,______是一种非关系型数据库,它以键值对的形式存储数据。

19.在大数据技术中,______是一种分布式文件系统,用于存储大规模数据集。

20.数据仓库中,______模式是一种常用的数据模型,它以一个中心表为核心,其他表通过外键与之关联。

四、判断题(共5题)

21.大数据技术中的Hadoop只适用于处理结构化数据。()

A.正确B.错误

22.在数据挖掘过程中,数据预处理是必须的步骤。()

A.正确B.错误

23.数据仓库中的雪花模式比星型模式更复杂,但查询性能更好。()

A.正确B.错误

24.Redis是一个支持事务的数据库系统。()

A.正确B.错误

25.NoSQL数据库不提供SQL查询语言支持。()

A.正确B.错误

五、简单题(共5题)

26.请简

文档评论(0)

1亿VIP精品文档

相关文档