- 0
- 0
- 约2.69千字
- 约 5页
- 2026-01-23 发布于广东
- 举报
2026秋招:大数据真题及答案
一、单项选择题(每题2分,共20分)
1.下列哪个不是大数据的特点?()
A.大量B.高速C.高价D.多样
2.Hadoop框架中,负责资源管理和调度的是()
A.HDFSB.MapReduceC.YARND.HBase
3.Spark中RDD是什么?()
A.分布式数据集B.单一数据集C.本地数据集D.内存数据集
4.以下哪个是NoSQL数据库?()
A.MySQLB.OracleC.MongoDBD.SQLServer
5.大数据处理流程中,数据采集后下一步是()
A.数据存储B.数据清洗C.数据分析D.数据可视化
6.常用于实时流处理的框架是()
A.HadoopB.SparkStreamingC.PigD.Hive
7.数据仓库用于()
A.交易处理B.分析决策C.数据存储D.数据传输
8.大数据分析中,分类算法属于()
A.监督学习B.无监督学习C.强化学习D.半监督学习
9.HDFS存储数据的基本单位是()
A.块B.行C.列D.文件
10.以下哪个是数据可视化工具?()
A.PythonB.R语言C.TableauD.Scala
答案:1.C2.C3.A4.C5.A6.B7.B8.A9.A10.C
二、多项选择题(每题2分,共20分)
1.大数据技术栈包含以下哪些组件?()
A.HadoopB.SparkC.KafkaD.Redis
2.常见的数据挖掘任务有()
A.分类B.聚类C.关联规则挖掘D.预测
3.以下属于分布式文件系统的有()
A.HDFSB.CephFSC.GlusterFSD.NTFS
4.实时数据处理的应用场景包括()
A.金融交易B.物联网监控C.电商推荐D.日志分析
5.数据仓库的特点有()
A.面向主题B.集成性C.稳定性D.时变性
6.Python中用于大数据处理的库有()
A.PandasB.NumPyC.MatplotlibD.Scikit-learn
7.大数据安全面临的挑战包括()
A.数据泄露B.数据篡改C.数据可用性D.数据隐私
8.NoSQL数据库的类型有()
A.键值存储B.文档存储C.列族存储D.图形存储
9.以下哪些属于数据治理的内容?()
A.数据质量管理B.元数据管理C.数据安全管理D.数据生命周期管理
10.分布式计算框架的优点有()
A.高可扩展性B.容错性C.高性能D.低成本
答案:1.ABCD2.ABCD3.ABC4.ABCD5.ABCD6.ABCD7.ABCD8.ABCD9.ABCD10.ABC
三、判断题(每题2分,共20分)
1.大数据就是大量的数据。()
2.Hadoop只适用于批处理。()
3.Spark可以完全替代Hadoop。()
4.数据仓库和数据库没有区别。()
5.实时数据处理的延迟可以忽略不计。()
6.所有的NoSQL数据库都不支持SQL语句。()
7.Python是大数据分析中唯一可用的编程语言。()
8.大数据安全只需要保护数据的保密性。()
9.数据可视化只是为了让数据看起来更美观。()
10.分布式计算可以提高数据处理的效率。()
答案:1.×2.×3.×4.×5.×6.×7.×8.×9.×10.√
四、简答题(每题5分,共20分)
1.简述大数据的5V特点。
答:大数据5V特点为大量(Volume),数据规模巨大;高速(Velocity),处理速度快;多样(Variety),数据类型繁多;价值(Value),数据价值密度低;真实性(Veracity),数据需保证真实可靠。
2.对比Hadoop和Spark的适用场景。
答:Hadoop适用于大规模数据的批处理,如离线数据存储和分析,对数据处理时间不敏感的场景。Spark适合实时数据处理、交互式查询和
您可能关注的文档
最近下载
- 重症肺结核诊断和治疗专家共识.pptx VIP
- 某某市税务局“岗位大练兵 业务大比武”活动实施方案范本.doc VIP
- T∕CSAE 91-2018 汽车生命周期温室气体及大气污染物排放评价方法.pdf
- 个人独资企业章程.pdf VIP
- 2026年中小学寒假安全教育主题班会课件PPT.pptx VIP
- 5 《火灾自动报警系统施工及验收规范》(GB50166--92)附表.pdf VIP
- 光伏电站并网启动调试方案.pdf VIP
- pNC系统载体使用说明.PDF
- 小学篮球兴趣小组教学计划范文(32篇).docx VIP
- 山东省临沂市罗庄区2024-2025学年七年级上学期期末考试地理试题.pdf VIP
原创力文档

文档评论(0)