2025年最新公需科目《大数据》模拟题库(含答案).docxVIP

2025年最新公需科目《大数据》模拟题库(含答案).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年最新公需科目《大数据》模拟题库(含答案)

一、单项选择题(每题2分,共20题)

1.下列哪项不属于大数据的“4V”特征?

A.大量(Volume)

B.高速(Velocity)

C.多样(Variety)

D.安全(Security)

答案:D

2.Hadoop分布式文件系统(HDFS)的主要设计目标是?

A.支持小文件高效存储

B.提供低延迟数据访问

C.处理海量大文件的分布式存储

D.实现实时数据计算

答案:C

3.数据仓库(DataWarehouse)与传统数据库的核心区别是?

A.数据结构更复杂

B.支持事务处理(OLTP)

C.面向分析型应用(OLAP)

D.存储非结构化数据

答案:C

4.数据清洗的主要目的是?

A.增加数据量

B.消除数据中的错误、冗余和不一致

C.转换数据格式

D.提升数据存储效率

答案:B

5.Spark计算框架的核心抽象是?

A.分布式文件系统(DFS)

B.弹性分布式数据集(RDD)

C.键值对存储(Key-Value)

D.流数据窗口(Window)

答案:B

6.以下哪项属于流处理框架?

A.HadoopMapReduce

B.ApacheFlink

C.Hive

D.Pig

答案:B

7.数据可视化工具Tableau的主要功能是?

A.数据存储与管理

B.实时数据计算

C.通过图表直观展示数据规律

D.数据清洗与转换

答案:C

8.以下哪种技术属于大数据隐私保护范畴?

A.数据脱敏

B.数据压缩

C.数据索引

D.数据复制

答案:A

9.非结构化数据的典型例子是?

A.关系型数据库表

B.传感器实时采集的数值

C.社交媒体文本、图片

D.财务报表中的结构化字段

答案:C

10.大数据在医疗领域的核心应用是?

A.医院收费系统优化

B.患者病历电子化

C.基于基因组数据的精准医疗

D.医疗设备库存管理

答案:C

11.以下哪项是NoSQL数据库的特点?

A.严格遵循ACID特性

B.支持复杂SQL查询

C.适用于海量非结构化数据存储

D.仅支持单节点部署

答案:C

12.机器学习中,“过拟合”现象是指?

A.模型在训练数据上表现差,在测试数据上表现好

B.模型在训练数据上表现好,在测试数据上表现差

C.模型无法处理大规模数据

D.模型参数过少导致泛化能力弱

答案:B

13.大数据分析中,“关联规则挖掘”的典型应用是?

A.预测用户未来购买行为

B.发现“啤酒与尿布”的消费关联

C.识别数据中的异常值

D.对客户进行分群

答案:B

14.边缘计算(EdgeComputing)与云计算的主要区别是?

A.边缘计算更依赖中心服务器

B.边缘计算在数据源头附近处理数据

C.云计算仅处理结构化数据

D.边缘计算不支持实时分析

答案:B

15.以下哪项属于大数据技术栈中的存储层?

A.ApacheKafka

B.HBase

C.SparkStreaming

D.Flume

答案:B

16.数据湖(DataLake)与数据仓库的主要差异是?

A.数据湖仅存储结构化数据

B.数据仓库存储原始未处理数据

C.数据湖支持多类型数据存储与灵活分析

D.数据仓库不支持实时查询

答案:C

17.联邦学习(FederatedLearning)的核心目标是?

A.集中所有数据进行训练

B.在不共享原始数据的前提下联合建模

C.仅使用单一机构数据提升模型精度

D.降低数据存储成本

答案:B

18.以下哪项是大数据时代数据质量的关键指标?

A.数据存储成本

B.数据完整性、准确性、一致性

C.数据处理速度

D.数据可视化美观度

答案:B

19.区块链技术与大数据结合的典型应用是?

A.提高数据计算速度

B.保障数据溯源与防篡改

C.替代传统数据库存储

D.简化数据清洗流程

答案:B

20.大数据伦理问题的核心矛盾是?

A.数据处理效率与存储成本

B.数据价值挖掘与隐私保护

C.结构化数据与非结构化数据处理

D.国内数据与跨境数据流

文档评论(0)

yclsb001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档