- 0
- 0
- 约3.6千字
- 约 7页
- 2026-07-04 发布于北京
- 举报
2023年云南大数据公司校招内推笔试题及答案整理
一、单项选择题(总共10题,每题2分)。
1.大数据的“Volume”特征主要描述数据的什么属性?(A.多样性B.容量C.生成速度D.价值密度)
2.Hadoop生态系统中,负责分布式文件存储的核心组件是?(A.YARNB.MapReduceC.HDFSD.Hive)
3.下列哪项不属于数据预处理的常见步骤?(A.数据清洗B.数据集成C.数据挖掘D.数据转换)
4.实时流数据处理场景中,常用于高吞吐、低延迟的数据传输工具是?(A.HiveB.KafkaC.HBaseD.Pig)
5.数据仓库的核心功能是?(A.实时数据更新B.支持联机分析处理(OLAP)C.数据实时可视化D.存储原始数据)
6.以下哪种工具常用于数据可视化展示用户行为分布?(A.ExcelB.TableauC.MySQLD.Git)
7.数据清洗中,处理重复数据的常用方法是?(A.直接删除B.均值填充C.插值法D.众数填充)
8.大数据隐私保护中,“差分隐私”的核心作用是?(A.提升数据传输速度B.隐藏个人敏感信息C.加密数据存储D.压缩数据体积)
9.云南某旅游景区利用大数据分析游客热力图,优化游览路线,这属于大数据的哪种应用场景?
原创力文档

文档评论(0)