- 5
- 0
- 约5.31千字
- 约 6页
- 2026-05-25 发布于河北
- 举报
大数据算法笔试题及详细答案
一、选择题(每题5分,共30分)
1.下列哪种算法不属于大数据常用的聚类算法()
A.K-MeansB.DBSCANC.SVMD.层次聚类
2.关于HadoopMapReduce,下列说法错误的是()
A.Map阶段负责数据拆分和局部处理,Reduce阶段负责汇总计算
B.Map输出的键值对会经过Shuffle阶段排序、分区
C.一个MapTask可以对应多个ReduceTask
D.ReduceTask的数量越多,计算效率一定越高
3.大数据处理中,“数据倾斜”产生的主要原因是()
A.数据量过大B.部分键的出现频率过高C.服务器性能差异D.网络延迟
4.下列关于Spark与MapReduce的对比,说法正确的是()
A.Spark的计算速度一定比MapReduce快
B.Spark基于内存计算,MapReduce基于磁盘计算
C.Spark不支持批处理,只支持流处理
D.Spark的容错性比MapReduce差
5.用于解决“协同过滤推荐”中冷启动问题的方法是()
A.增加数据量B.基于内容的推荐补充C.减少推荐维度D.提高算法复杂度
6.下列哪种数据结构更适合大数据场景下的快速查找和插入()
A.数组B.链表C.哈希表
您可能关注的文档
最近下载
- 2026人教版语文二年级下册期末总复习综合试卷(3套含答案解析).pdf
- 消防安全教育培训课件.pptx VIP
- 2026年卫生高级职称考试(中医肛肠代码080)(副高)冲刺试题及答案汇总.docx VIP
- 安全培训通用.pdf VIP
- 年产840W10寸汤盘隧道窑设计.pdf VIP
- 2025年初中初二语文阅读理解模拟试卷.docx VIP
- DELTA台达-台达小型泛用无感测矢量变频器 VFD-EL-W系列 使用手册-操作说明书.pdf
- TCECS225-2020 建筑物移位纠倾增层与改造技术标准(附条文说明).pdf VIP
- 2026年胸痛中心应知应会知识考试试题及答案.docx VIP
- IEC60812(FMEA)-失效模式及影响分析.pdf VIP
原创力文档

文档评论(0)