2025年最新公需科目《大数据》完整版考核题库(含参考答案).docxVIP

  • 4
  • 0
  • 约7.89千字
  • 约 26页
  • 2025-10-21 发布于四川
  • 举报

2025年最新公需科目《大数据》完整版考核题库(含参考答案).docx

2025年最新公需科目《大数据》完整版考核题库(含参考答案)

一、单项选择题(每题2分,共30题)

1.下列哪项不属于大数据4V特征?

A.Volume(大量)

B.Velocity(高速)

C.Veracity(真实)

D.Validity(有效)

答案:D

2.分布式文件系统HDFS的默认块大小是?

A.32MB

B.64MB

C.128MB

D.256MB

答案:C

3.以下哪种数据库适用于实时写入、海量数据存储场景?

A.关系型数据库(如MySQL)

B.键值数据库(如Redis)

C.列族数据库(如HBase)

D.图数据库(如Neo4j)

答案:C

4.数据清洗的主要目的是?

A.增加数据量

B.消除数据中的噪声和不一致

C.转换数据格式

D.建立数据索引

答案:B

5.下列不属于Spark核心组件的是?

A.SparkSQL

B.SparkStreaming

C.SparkMLlib

D.Hive

答案:D

6.隐私计算中联邦学习的核心目标是?

A.集中所有数据进行训练

B.在不共享原始数据的前提下联合建模

C.提升数据存储效率

D.增强数据加密强度

答案:B

7.大数据分析中,关联分析主要用于发现?

A.数据随时间变化的趋势

B.不同数据项之间的内在联系

C.数据中的异常值

D.数据的分布特征

答案:B

8.以下哪项属于非结构化数据?

A.财务报表Excel文件

B.监控视频

C.客户信息数据库表

D.气象观测数值

答案:B

9.数据湖(DataLake)与数据仓库(DataWarehouse)的主要区别是?

A.数据湖存储结构化数据,数据仓库存储非结构化数据

B.数据湖在存储时不定义模式,数据仓库在存储前定义模式

C.数据湖仅用于分析,数据仓库仅用于事务处理

D.数据湖容量更小,数据仓库容量更大

答案:B

10.下列哪项技术属于流数据处理框架?

A.HadoopMapReduce

B.ApacheFlink

C.ApacheHive

D.ApachePig

答案:B

11.大数据安全的最小权限原则指的是?

A.仅授予必要的数据访问权限

B.尽可能降低数据存储权限

C.限制数据处理的计算资源

D.减少数据传输的网络带宽

答案:A

12.数据可视化工具Tableau的主要功能是?

A.数据清洗与转换

B.数据存储与管理

C.交互式数据图表制作

D.机器学习模型训练

答案:C

13.以下哪种算法属于无监督学习?

A.逻辑回归

B.Kmeans聚类

C.决策树分类

D.线性回归

答案:B

14.边缘计算在大数据场景中的主要作用是?

A.将所有计算任务集中到云端

B.在数据产生源头附近进行实时处理

C.提升数据传输速率

D.降低数据存储成本

答案:B

15.数据治理的核心目标是?

A.最大化数据存储量

B.确保数据质量、安全性和可管理性

C.提高数据处理速度

D.开发更多数据应用场景

答案:B

16.下列哪项属于大数据时代的新型数据采集方式?

A.人工录入Excel表格

B.传感器网络实时采集

C.扫描纸质文档

D.键盘输入业务系统

答案:B

17.区块链技术与大数据结合的典型应用是?

A.提升数据计算速度

B.实现数据的可追溯与防篡改

C.扩大数据存储容量

D.简化数据清洗流程

答案:B

18.数据生命周期管理的阶段不包括?

A.数据采集

B.数据销毁

C.数据交易

D.数据归档

答案:C

19.以下哪项属于大数据分析中的预测分析?

A.统计过去一年的销售总额

B.识别用户消费模式的聚类

C.预测下季度的销售额

D.分析产品差评的关键词

答案:C

20.数据脱敏技术中,匿名化与去标识化的主要区别是?

A.匿名化不可逆,去标识化可逆

B.匿名化可逆,去标识化不可逆

C.匿名化仅处理结构化数据,去标识化处理非结构化数据

D.匿名化用于内部使用,去标识化用于外部共享

答案:A

21.下列哪项属于Hadoop生态中的资源管理工具?

A.HBase

B.YARN

C.Spark

D.Flume

答案:B

22.数据质量的完整性指标主要考察?

A.数据是否准确反映真实情况

B.数据是否存在缺失字段或记录

C.数据格式是否符合要求

D.数据是否在规定时间内可用

答案:B

23.联邦学习的三种主要类型不包括?

A.横向联邦学习

B.纵向联邦学习

C.联合联邦学习

D.迁移联邦学习

答案:C

24.实时数据处理与批量数据处理的主要区别是?

A.实时处理处理历史数据,批量处理处理实时数据

文档评论(0)

1亿VIP精品文档

相关文档