- 0
- 0
- 约4.57千字
- 约 15页
- 2025-12-09 发布于福建
- 举报
第PAGE页共NUMPAGES页
大数据处理与分析专业技能测试答案解析
一、单选题(每题2分,共20题)
1.在Hadoop生态系统中,用于分布式文件存储的系统是?
A.HBase
B.Hive
C.HDFS
D.YARN
答案:C
解析:HDFS(HadoopDistributedFileSystem)是Hadoop的核心组件,专门设计用于在集群中存储大规模数据集。HBase是分布式数据库,Hive是数据仓库工具,YARN是资源管理框架。
2.以下哪种算法不属于聚类算法?
A.K-Means
B.DBSCAN
C.决策树
D.层次聚类
答案:C
解析:决策树属于分类和回归算法,而K-Means、DBSCAN、层次聚类都是聚类算法,用于将数据分组。
3.Spark中,哪种模式最适合交互式数据分析?
A.Standalone模式
B.YARN模式
C.Mesos模式
D.Client模式
答案:D
解析:Client模式允许用户直接与Spark集群交互,适合交互式数据分析;而Standalone、YARN、Mesos更多用于生产环境。
4.在数据预处理中,处理缺失值最常用的方法是?
A.删除缺失值
B.插值法
C.均值/中位数填充
D.以上都是
答案:D
解析:删除、插值、均值/中位数填充都是处理缺失值的方法,具体选
原创力文档

文档评论(0)