2025年最新公需科目《大数据》考试题库(含标准答案).docxVIP

2025年最新公需科目《大数据》考试题库(含标准答案).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年最新公需科目《大数据》考试题库(含标准答案)

一、单项选择题

1.下列哪项不属于大数据的“5V”特征?()

A.大量(Volume)B.高速(Velocity)C.多样(Variety)D.可变性(Volatility)

答案:D

解析:大数据的“5V”特征为大量(Volume)、高速(Velocity)、多样(Variety)、低价值密度(Value)、真实性(Veracity),可变性(Volatility)不属于核心特征。

2.Hadoop生态中,负责资源管理和任务调度的组件是()。

A.HDFSB.MapReduceC.YARND.HBase

答案:C

解析:YARN(YetAnotherResourceNegotiator)是Hadoop的资源管理系统,负责集群资源的统一管理和任务调度;HDFS是分布式文件系统,MapReduce是计算框架,HBase是列式数据库。

3.数据挖掘的核心步骤是()。

A.数据清洗B.模型构建C.结果评估D.数据预处理

答案:B

解析:数据挖掘的流程包括数据理解、数据准备、模型构建、模型评估和结果部署,其中模型构建是核心,直接决定分析效果。

4.以下哪种技术适用于实时数据流处理?()

A.HiveB.SparkSQLC.FlinkD.HBase

答案:C

解析:Flink是专为流处理设计的框架,支持低延迟、高吞吐的实时数据处理;Hive是批处理工具,SparkSQL侧重离线分析,HBase是存储系统。

5.数据仓库(DataWarehouse)与传统数据库的主要区别是()。

A.支持事务处理B.面向主题C.实时更新D.结构固定

答案:B

解析:数据仓库面向主题(如销售、客户),用于支持决策分析;传统数据库面向事务(如订单处理),支持实时增删改。

6.下列哪项属于非结构化数据?()

A.Excel表格B.关系型数据库记录C.视频文件D.财务报表

答案:C

解析:非结构化数据无固定格式,如文本、图片、视频;结构化数据(Excel、数据库记录)和半结构化数据(XML、JSON)有明确格式。

7.隐私计算中,“联邦学习”的核心目标是()。

A.集中所有数据训练模型B.在不共享原始数据的前提下联合建模C.加密所有数据后存储D.提高模型训练速度

答案:B

解析:联邦学习通过加密通信在多个参与方间联合训练模型,避免原始数据流出,保护隐私。

8.大数据分析中,“关联规则挖掘”常用的算法是()。

A.K-meansB.AprioriC.SVMD.决策树

答案:B

解析:Apriori算法用于发现数据项之间的关联关系(如“买啤酒的人常买尿布”);K-means是聚类算法,SVM和决策树用于分类。

9.下列哪项不属于大数据安全的关键问题?()

A.数据泄露B.数据主权C.数据可视化D.数据篡改

答案:C

解析:数据可视化是分析结果的呈现方式,不属于安全问题;数据泄露、主权、篡改均涉及数据安全与隐私保护。

10.智慧城市中,大数据技术最核心的应用是()。

A.交通流量预测B.智能路灯控制C.垃圾清运调度D.市民信息登记

答案:A

解析:交通流量预测通过实时采集传感器、GPS等数据,结合模型分析优化交通调度,是智慧城市的核心应用之一。

二、多项选择题

1.大数据技术体系主要包括()。

A.数据采集B.数据存储C.数据处理D.数据应用

答案:ABCD

解析:大数据技术体系涵盖从采集(如Flume、Kafka)、存储(如HDFS、NoSQL)、处理(如Spark、Flink)到应用(如机器学习、可视化)的全流程。

2.数据清洗的主要内容包括()。

A.处理缺失值B.检测异常值C.删除重复数据D.转换数据格式

答案:ABCD

解析:数据清洗是提高数据质量的关键步骤,包括处理缺失值(填充/删除)、检测异常值(如Z-score法)、删除重复数据(如去重算法)、转换格式(如日期统一)等。

3.下列属于NoSQL数据库的有()。

A.MySQLB.HBaseC.RedisD.MongoDB

答案:BCD

解析:NoSQL(NotOnlySQL)包括列式(HBase)、键值(Redis)、文档(MongoDB)等类型;MySQL是关系型数据库。

4.大数据隐私

文档评论(0)

yclsb001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档