- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年最新公需科目《大数据》考试题库(含标准答案)
一、单项选择题
1.下列哪项不属于大数据的“5V”特征?()
A.大量(Volume)B.高速(Velocity)C.多样(Variety)D.可变性(Volatility)
答案:D
解析:大数据的“5V”特征为大量(Volume)、高速(Velocity)、多样(Variety)、低价值密度(Value)、真实性(Veracity),可变性(Volatility)不属于核心特征。
2.Hadoop生态中,负责资源管理和任务调度的组件是()。
A.HDFSB.MapReduceC.YARND.HBase
答案:C
解析:YARN(YetAnotherResourceNegotiator)是Hadoop的资源管理系统,负责集群资源的统一管理和任务调度;HDFS是分布式文件系统,MapReduce是计算框架,HBase是列式数据库。
3.数据挖掘的核心步骤是()。
A.数据清洗B.模型构建C.结果评估D.数据预处理
答案:B
解析:数据挖掘的流程包括数据理解、数据准备、模型构建、模型评估和结果部署,其中模型构建是核心,直接决定分析效果。
4.以下哪种技术适用于实时数据流处理?()
A.HiveB.SparkSQLC.FlinkD.HBase
答案:C
解析:Flink是专为流处理设计的框架,支持低延迟、高吞吐的实时数据处理;Hive是批处理工具,SparkSQL侧重离线分析,HBase是存储系统。
5.数据仓库(DataWarehouse)与传统数据库的主要区别是()。
A.支持事务处理B.面向主题C.实时更新D.结构固定
答案:B
解析:数据仓库面向主题(如销售、客户),用于支持决策分析;传统数据库面向事务(如订单处理),支持实时增删改。
6.下列哪项属于非结构化数据?()
A.Excel表格B.关系型数据库记录C.视频文件D.财务报表
答案:C
解析:非结构化数据无固定格式,如文本、图片、视频;结构化数据(Excel、数据库记录)和半结构化数据(XML、JSON)有明确格式。
7.隐私计算中,“联邦学习”的核心目标是()。
A.集中所有数据训练模型B.在不共享原始数据的前提下联合建模C.加密所有数据后存储D.提高模型训练速度
答案:B
解析:联邦学习通过加密通信在多个参与方间联合训练模型,避免原始数据流出,保护隐私。
8.大数据分析中,“关联规则挖掘”常用的算法是()。
A.K-meansB.AprioriC.SVMD.决策树
答案:B
解析:Apriori算法用于发现数据项之间的关联关系(如“买啤酒的人常买尿布”);K-means是聚类算法,SVM和决策树用于分类。
9.下列哪项不属于大数据安全的关键问题?()
A.数据泄露B.数据主权C.数据可视化D.数据篡改
答案:C
解析:数据可视化是分析结果的呈现方式,不属于安全问题;数据泄露、主权、篡改均涉及数据安全与隐私保护。
10.智慧城市中,大数据技术最核心的应用是()。
A.交通流量预测B.智能路灯控制C.垃圾清运调度D.市民信息登记
答案:A
解析:交通流量预测通过实时采集传感器、GPS等数据,结合模型分析优化交通调度,是智慧城市的核心应用之一。
二、多项选择题
1.大数据技术体系主要包括()。
A.数据采集B.数据存储C.数据处理D.数据应用
答案:ABCD
解析:大数据技术体系涵盖从采集(如Flume、Kafka)、存储(如HDFS、NoSQL)、处理(如Spark、Flink)到应用(如机器学习、可视化)的全流程。
2.数据清洗的主要内容包括()。
A.处理缺失值B.检测异常值C.删除重复数据D.转换数据格式
答案:ABCD
解析:数据清洗是提高数据质量的关键步骤,包括处理缺失值(填充/删除)、检测异常值(如Z-score法)、删除重复数据(如去重算法)、转换格式(如日期统一)等。
3.下列属于NoSQL数据库的有()。
A.MySQLB.HBaseC.RedisD.MongoDB
答案:BCD
解析:NoSQL(NotOnlySQL)包括列式(HBase)、键值(Redis)、文档(MongoDB)等类型;MySQL是关系型数据库。
4.大数据隐私
您可能关注的文档
- 2025年水利水电工程企业关注点试题及答案.docx
- 2025年水利水电工程土木工程试题及答案.docx
- 2025年水利水电工程学科交叉知识试题及答案.docx
- 2025年水利五大员继续教育考试题(含答案).docx
- 2025年水利专业技术人员专业科目继续教育考试题(附答案).docx
- 2025年有限空间作业安全防护措施测试题库试题(附答案).docx
- 2025年梓潼县中医院护理核心制度培训考试题(附答案).docx
- 2025年最新保密观知识竞赛题库(含参考答案).docx
- 2025年最新反洗钱知识竞赛题库(附含答案).docx
- 2025年最新干部任前廉政知识考试题库及答案.docx
- 2025年最新公需科目《大数据》考试题库(含参考答案).docx
- 2025年最新公需科目《大数据》模拟题库(含答案).docx
- 2025年最新公需科目《大数据》完整版考核题库(含参考答案).docx
- 2025年最新公需科目《大数据》完整考试题库(含参考答案).docx
- 2025年最新公需科目《大数据》完整考试题库(含答案).docx
- 2025年最新公需科目大数据测试版题库(含标准答案).docx
- 2025年最新公需科目大数据考核题库完整版(含答案).docx
- 2025年最新公需科目大数据考试题库(含参考答案).docx
- 2025年最新公需科目大数据模拟考试题库(含参考答案).docx
- 2025年最新公需科目大数据模拟考试题库(含答案).docx
最近下载
- 天津财经大学2024届毕业生就业质量报告.pdf VIP
- 部编人教版五年级数学上册《小数乘法(全章)》PPT教学课件.ppt VIP
- 数字集成电路部分课后习题chapter11ex.pdf VIP
- 安全通信与安全通信标准EN50159.pdf VIP
- 消防安全管理方案.docx VIP
- 锂电池储能系统技术协议.docx VIP
- 四年级数学下册《每日一练》全52套.pdf VIP
- 2025年福建厦门海关口岸门诊部招聘检验检测岗8人笔试附带答案详解.docx VIP
- 部编版语文四年级上册全册教案.pdf VIP
- DB37_T 4614.2-2023 “爱山东”政务服务平台移动端 第2部分:运营管理规范.docx VIP
文档评论(0)