- 1
- 0
- 约3.67千字
- 约 7页
- 2026-05-10 发布于天津
- 举报
大数据分析试卷及答案
考试时间:______分钟总分:______分姓名:______
选择题(每题2分,共20分)
1.大数据的特征不包括以下哪一项?
A.Volume
B.Velocity
C.Variety
D.Validity
2.在Hadoop生态系统中,HDFS的主要组件是?
A.NameNode和DataNode
B.JobTracker和TaskTracker
C.Master和Slave
D.Client和Server
3.Spark与Hadoop的核心区别在于?
A.分布式存储能力
B.内存计算能力
C.文件系统兼容性
D.任务调度机制
4.数据标准化方法中,Z-score标准化适用于?
A.非正态分布数据
B.正态分布数据
C.类别型数据
D.高维稀疏数据
5.机器学习中,K-means聚类的损失函数是?
A.交叉熵
B.均方误差
C.SSE(误差平方和)
D.信息增益
6.Hive的主要功能是?
A.实时数据处理
B.分布式文件存储
C.数据仓库查询
D.流式计算
7.数据清洗步骤中,处理缺失值的方法不包括?
A.删除含缺失值的行
原创力文档

文档评论(0)