- 0
- 0
- 约7.83千字
- 约 10页
- 2026-03-14 发布于山东
- 举报
2026年大数据游戏答题题库及答案
一、基础必答题(每题2分,共40分,答对得分,答错不扣分)
1.大数据的核心特征不包括以下哪一项()
A.海量性(Volume)B.高速性(Velocity)C.单一性(Uniqueness)D.价值性(Value)
2.下列不属于大数据存储技术的是()
A.HDFSB.MySQLC.HBaseD.MongoDB
3.大数据处理流程的正确顺序是()
A.数据采集→数据清洗→数据存储→数据处理→数据可视化
B.数据存储→数据采集→数据清洗→数据处理→数据可视化
C.数据采集→数据存储→数据清洗→数据处理→数据可视化
D.数据采集→数据处理→数据清洗→数据存储→数据可视化
4.下列哪种数据属于非结构化数据()
A.Excel表格中的销售数据B.数据库中的用户IDC.朋友圈的文字+图片动态D.财务报表中的数字
5.Hadoop生态系统中,负责分布式计算的核心组件是()
A.HDFSB.MapReduceC.YARND.Hive
6.大数据分析中,“聚类分析”属于哪种分析类型()
A.描述性分析B.诊断性分析C.预测性分析D.规范性分析
7.下列哪种工具常用于大数据可视化()
A.PythonB.TableauC.JavaD.C++
8.数据清洗的核心目的是()
A.增加数据量B.去除无效、错误、重复的数据C.加密数据D.压缩数据
9.下列不属于大数据应用场景的是()
A.电商平台个性化推荐B.天气预报预测C.传统书信往来D.交通流量调度
10.结构化数据的存储格式通常是()
A.表格形式B.图片形式C.音频形式D.视频形式
11.大数据时代,数据安全的核心需求不包括()
A.保密性B.完整性C.可操作性D.可用性
12.下列哪种技术用于处理实时大数据流()
A.HadoopB.SparkStreamingC.HBaseD.Redis
13.数据挖掘的目的是()
A.收集更多数据B.从海量数据中发现隐藏的规律和价值C.删除无用数据D.备份数据
14.下列属于半结构化数据的是()
A.JSON文件B.纯文本日志C.高清图片D.关系型数据库表
15.Spark与Hadoop相比,最大的优势是()
A.存储容量更大B.计算速度更快C.更适合处理结构化数据D.部署更简单
16.大数据中的“数据倾斜”问题是指()
A.数据存储位置不均衡B.部分数据量过大,导致计算负载不均C.数据格式不统一D.数据丢失
17.下列哪种算法不属于大数据分析中的机器学习算法()
A.决策树B.线性回归C.MapReduceD.随机森林
18.数据采集过程中,下列哪种方式属于间接采集()
A.传感器采集设备运行数据B.从第三方数据平台购买数据C.人工录入用户信息D.摄像头采集监控数据
19.下列哪种数据库属于NoSQL数据库()
A.MySQLB.OracleC.MongoDBD.SQLServer
20.大数据对社会发展的影响,下列说法错误的是()
A.提高生产效率B.优化资源配置C.只会带来便利,无任何风险D.推动产业升级
二、趣味抢答题(每题1分,共20分,答对得分,答错扣0.5分)
1.大数据的“4V”特征中,Volume指的是数据的海量性,通常以TB、PB级别计量。()
2.Python是大数据分析中最常用的编程语言之一,但其无法处理非结构化数据。()
3.我们日常刷短视频时,平台的“推荐页”内容,就是大数据个性化推荐的典型应用。()
4.HDFS是Hadoop生态系统中用于分布式计算的组件,可快速处理海量数据。()
5.数据清洗过程中,对于缺失值,只能选择删除,无法进行填充。()
6.非结构化数据占当前所有数据的比例超过80%,包括图片、音频、视频等。()
7.SparkStreaming可以处理实时数据流,延迟可达到秒级。()
8.关系型数据库(如MySQL)比NoSQL数据库更适合存储海量非结构化数据。()
9.大数据分析可以预测用户的消费习惯,帮助商家精准营销。()
10.数据挖掘和大数据分析是同一个概念,没有本质区别。()
11.Redis是一种内存数据库,常用于缓存大数据处理中的中间结果。()
12.
原创力文档

文档评论(0)