大数据算法笔试题及详细答案.docxVIP

  • 5
  • 0
  • 约5.31千字
  • 约 6页
  • 2026-05-25 发布于河北
  • 举报

大数据算法笔试题及详细答案

一、选择题(每题5分,共30分)

1.下列哪种算法不属于大数据常用的聚类算法()

A.K-MeansB.DBSCANC.SVMD.层次聚类

2.关于HadoopMapReduce,下列说法错误的是()

A.Map阶段负责数据拆分和局部处理,Reduce阶段负责汇总计算

B.Map输出的键值对会经过Shuffle阶段排序、分区

C.一个MapTask可以对应多个ReduceTask

D.ReduceTask的数量越多,计算效率一定越高

3.大数据处理中,“数据倾斜”产生的主要原因是()

A.数据量过大B.部分键的出现频率过高C.服务器性能差异D.网络延迟

4.下列关于Spark与MapReduce的对比,说法正确的是()

A.Spark的计算速度一定比MapReduce快

B.Spark基于内存计算,MapReduce基于磁盘计算

C.Spark不支持批处理,只支持流处理

D.Spark的容错性比MapReduce差

5.用于解决“协同过滤推荐”中冷启动问题的方法是()

A.增加数据量B.基于内容的推荐补充C.减少推荐维度D.提高算法复杂度

6.下列哪种数据结构更适合大数据场景下的快速查找和插入()

A.数组B.链表C.哈希表

文档评论(0)

1亿VIP精品文档

相关文档